Die Pandas-Bibliothek. Arbeiten mit den Grunddaten… | von Dhanush Pamulapati | Juli 2023

0
24


Es handelt sich im Wesentlichen um eine 2D-Serie.

Der DataFrame verfügt sowohl über einen Zeilen- als auch über einen Spaltenindex. Man kann es sich als ein Diktat einer Serie vorstellen (eine für alle, die denselben Index haben).
~ Python für Datenanalyse, Wes Mckinney.

Hinweis: Indizes können nicht eindeutig sein. Alle entsprechenden Werte eines Index werden zurückgegeben, wenn eine Operation für einen nicht eindeutigen Index ausgeführt wird.

Erstellen eines DataFrame

Mehrere Serien:

Erstellen eines Datenrahmens aus mehreren Serien

Liste der Wörterbücher:

Erstellung aus einer Liste von Wörterbüchern
Erstellung aus einer Liste von Wörterbüchern

Abfragen eines DataFrame:

Obwohl es der Vorgehensweise in einer Serie ziemlich ähnlich ist, gibt es doch einige interessante zusätzliche Möglichkeiten.

Der resultierende Abfragetyp für den Zugriff auf einen Teil des DataFrame kann von den folgenden Typen sein:

a) Objekttyp (der NumPy-Elementtyp an dieser Place). [ When single element is returned].
b) pandas.core.sequence.Sequence [When a row or column is returned, because of more than one index being present].
c) pandas.core.body.DataFrame [When multiple values corresponding to both indices are present].

  1. Auswahl achsenübergreifender Werte

    Wir können einen Wert auswählen, der gleichzeitig auf dem Zeilen- und Spaltenindex basiert. Zum Beispiel,

Zugriff auf (ein) bestimmte(s) Ingredient(e) in DataFrame

2. Auf Spalten zugreifen

Auf eine Spalte zugreifen

Tatsächlich wird loc verwendet, wie in df.loc[‘Column_Name’] produzieren würde ein Fehler.

3. Verwenden Sie loc, um eine bestimmte Teilmenge des DataFrame auszuwählen

Auswahl nur bestimmter Spalten des DataFrame

4. Inplace vs. Commonplace-Zuweisung

Die meisten Vorgänge an Datenrahmen werden ausgeführt, nachdem eine Kopie erstellt wurde. Wenn Sie eine Spalte hinzufügen, löschen oder Ähnliches, wird ein neuer DataFrame erstellt.

A) Generische Methode

df = df.drop(columns = ["Column_Name"])

Dabei geht es zunächst darum, zusätzlichen Speicher zu erstellen und ihn dann df zuzuweisen. Obwohl wir unser Ziel erreicht haben, haben wir unnötig Speicherplatz verschwendet.

B) Methode zur effizienten Lagerung

df = df.drop(columns = ["Column_Name"],inplace =True)

Dasist eine gute Lektüre, wenn Sie mehr über Inplace-Operationen erfahren möchten.



Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here