Wenn die Pandas aus dem Leben gerissen sind, wieso haben Sie sich für ein paar Tage Zeit genommen? Ich präsentiere Ihnen die Polars-Bibliothek!
In der Welt der Technologie sind uns die meisten Fragen, die wir mit der Frage beantworten, wie intestine es uns gelingt, sie auszuführen, mit der Antwort „Abhängig“ verbunden.
Angesichts der Unendlichkeit der Eisenhütten, die nun existierten, musste es bis zu dem Punkt, an dem es einmütig zerstört wurde, zerstört werden. Allerdings gibt es keine Welt, in der wir uns auf die Python- oder Pandas-Sprache beziehen, und das ist unser Ziel. Es ist nicht alles, was der Kurs bedeutet, den Sie in der Dados-Wissenschaft verspüren, oder Sie müssen sich auf den Weg machen, weil Sie gerade etwas mit Python zu tun haben, oder Pandas ist gerade dabei.
Als ich mich jedoch erst einmal mit der Polars-Bibliothek verabredete, hatte ich viele optimistic Eindrücke.
Er hat eine Reihe von Syntaxen mit den Pandas, inklusive, mit vielen Funktionen von Iguiais. Der große Vorteil von Polars besteht aus seiner Architektur und seiner Verarbeitungsart.
Polars: Arquitetura e Processamento dos Dados
Die großen Vorteile von Polars vor Pandas sind ihre Fähigkeit, Daten schnell und effizient zu manipulieren, und zwar deshalb, weil Polars eine Architektur von Datenspeichern verwendet (Streaming-Speicher), oder que es erlauben, die dados em pequeos conjuntos zu verarbeiten (Brocken), sem precisar carregar or conjunto de dos inteiro na memória. Anders als Pandas verwenden wir eine Datenstruktur, die auf Datenrahmen basiert und im Systemspeicher gesichert ist.
Der einzige Unterschied besteht darin, dass Polars in Rust gebaut wurde, eine neue Sprache, die eine schnellere Ausführung ermöglichte. Ich habe Pandas in Python gebaut, eine Sprache auf hohem Niveau und ein wenig später.
Weitere Merkmale von dp Polars:
- Unterstützt die Verarbeitung im großen Rahmen;
- Schnelle und effiziente Manipulationsvorgänge wie Filterung, Zusammenführung und Auswahl von Spalten;
- Unterstützung für die parallele Verarbeitung und Verteilung von Daten;
- Meistens bin ich auf Operationen angewiesen, die lineare Algebra beinhalten, wie z. B. Verbindungen, Anordnungen und Gruppen.
Wir haben uns mit den Hauptbefehlen der Polars beschäftigt, die den berühmten Titanic-Datensatz verwenden. Reparieren Sie wie verschiedene Befehle in Leguan oder viele andere von Pandas.
Set up und Import der Bilbiotecas
!pip set up polars
import polars as pl
Carregando Dados
df = pl.read_csv('train_titanic.csv')
Explorando Dados
df.form(891, 12)
df.columns['PassengerId',
'Survived',
'Pclass',
'Name',
'Sex',
'Age',
'SibSp',
'Parch',
'Ticket',
'Fare',
'Cabin',
'Embarked']
df.describe()
Es gibt noch viele andere Dinge, die man mit Pandas zu tun hat. Darüber hinaus verfügen die Polaren über eine Funktion Grenze, Ich erwidere die vier ersten und vier letzten Elemente der Verbindung. Geben Sie eine Nummer als Parameter ein (wie bei der Funktion). Kopf oder Schwanz (von Pandas) Wir antworteten mit der Wertigkeit der Registrierungsformulare, die von Anfang an bestellt worden waren.
df.restrict
df.restrict(5)
Selecionando Colunas
Normalerweise wählen Pandas speziell für Colchotes ausgewählte Colunas aus []wie Polars verwendet eine Funktion wählen.
df.choose('Age').restrict(3)
Filtrando Dados
O Pandas dürfen die Daten verschiedener Maneiras (iloc, loc, colchetes) filtern. O Polars haben eine Funktion Filter.
df.filter(pl.col('Embarked') == 'S').restrict(5)
Agregando Dados
Durch die Anwesenheit von Pandas und Polaren können auch Angriffe durch Menschen, Medien und Ansteckungen verursacht werden.
df['Age'].imply()
Sie können auch keine Polars verwenden gruppiere nachmit einer Syntax, die sich von Pandas unterscheiden kann.
pd_df.groupby('intercourse').agg({'total_bill': 'imply'})
Renomeando Colunas
Auch wenn Pandas oder Polars keine Funktion bieten umbenennen.
df.rename({'Identify':'FullName'}).restrict(3)
Ordenando os Dados
Für die Reihenfolge der Dados gibt es keine Pandas-Themen mit der Funktion sorte_values, keine Polars-Themen Sortieren.
df.type('Pclass').restrict(5)
Removendo Duplicatas
Zum Entfernen von Duplikaten oder Pandas gibt es die Funktion „drop_duplicate“. Ja, Polars haben eine Funktion einzigartig. Es ist wichtig, darauf zu achten Bei Pandas handelt es sich um eine neue Funktion, bei der wir die Werte einer Sorte zurückgeben.
df.distinctive('Embarked')
Contagem e Preenchimento de Valores Nulos
Keine Pandas nutzen die Funktion isna.sum, um die Ansteckung mit neuen Werten zu überprüfen, keine Polars nutzen die Funktion null_count. Um die Werte zu verbessern, werden keine Pandas oder Polars verwendet fill_null.
df.null_count()
df['Cabin'].fill_null(worth='1').restrict(5)
Estatística Descritiva
Sie werden von Bibliotheken genutzt, die eine Funktion haben beschreiben.
df.describe()
Contando Valores Únicos
Assim como no Pandas o value_counts Es werden auch keine Polaren verwendet, aber Sie glauben, dass Sie diese verwenden wählen Zur Auswahl einer Stelle, die Sie für die Funktion benötigen.
df.choose(pl.col('Intercourse').value_counts())
Es sind die Hauptkommandos von Polars.
Sie haben hier einen Hyperlink zur Dokumentation erstellt, damit Sie wissen, dass es sich um eine Rechtsbibliothek handelt und Sie sie erkunden können.
https://pola-rs.github.io/polars-book/user-guide/introduction.html
Fazit
O Pandas wurde dafür gesorgt, dass ich vor kurzem eine Hauptbibliothek für die Bearbeitung von Dados in Python gegründet habe, und zwar deshalb, weil er für mich ausgezeichnet ist, was ihn zu einem Versuch macht.
Da wir uns auf die großen Zusammenhänge zwischen den Daten und den Vertriebswegen beziehen, kann ich sagen, dass sie mehr als nur für Polars gedacht sind, aber ihr Ziel ist den Pandas-Nester-Fällen überlegen, und ihre Freunde sind mehr als Apache Spark, zum Beispiel .