Es handelt sich im Wesentlichen um eine 2D-Serie.
Der DataFrame verfügt sowohl über einen Zeilen- als auch über einen Spaltenindex. Man kann es sich als ein Diktat einer Serie vorstellen (eine für alle, die denselben Index haben).
~ Python für Datenanalyse, Wes Mckinney.
Hinweis: Indizes können nicht eindeutig sein. Alle entsprechenden Werte eines Index werden zurückgegeben, wenn eine Operation für einen nicht eindeutigen Index ausgeführt wird.
Erstellen eines DataFrame
Mehrere Serien:
Liste der Wörterbücher:
Abfragen eines DataFrame:
Obwohl es der Vorgehensweise in einer Serie ziemlich ähnlich ist, gibt es doch einige interessante zusätzliche Möglichkeiten.
Der resultierende Abfragetyp für den Zugriff auf einen Teil des DataFrame kann von den folgenden Typen sein:
a) Objekttyp (der NumPy-Elementtyp an dieser Place). [ When single element is returned].
b) pandas.core.sequence.Sequence [When a row or column is returned, because of more than one index being present].
c) pandas.core.body.DataFrame [When multiple values corresponding to both indices are present].
- Auswahl achsenübergreifender Werte
Wir können einen Wert auswählen, der gleichzeitig auf dem Zeilen- und Spaltenindex basiert. Zum Beispiel,
2. Auf Spalten zugreifen
Tatsächlich wird loc verwendet, wie in df.loc[‘Column_Name’] produzieren würde ein Fehler.
3. Verwenden Sie loc, um eine bestimmte Teilmenge des DataFrame auszuwählen
4. Inplace vs. Commonplace-Zuweisung
Die meisten Vorgänge an Datenrahmen werden ausgeführt, nachdem eine Kopie erstellt wurde. Wenn Sie eine Spalte hinzufügen, löschen oder Ähnliches, wird ein neuer DataFrame erstellt.
A) Generische Methode
df = df.drop(columns = ["Column_Name"])
Dabei geht es zunächst darum, zusätzlichen Speicher zu erstellen und ihn dann df zuzuweisen. Obwohl wir unser Ziel erreicht haben, haben wir unnötig Speicherplatz verschwendet.
B) Methode zur effizienten Lagerung
df = df.drop(columns = ["Column_Name"],inplace =True)
Dasist eine gute Lektüre, wenn Sie mehr über Inplace-Operationen erfahren möchten.