Jetzt können Sie jedes Data-Science-Projekt durchführen | von SANTHOSH KUMAR | Juni 2023

0
27


Hallo Jungs und Mädels, ich hoffe, es geht euch allen intestine. Jetzt melde ich mich mit einem brandneuen Thema für Sie zurück. Wir alle wissen, dass Datenwissenschaft der attraktivste Job dieses Jahrhunderts ist.

Aber wenn wir nichts über die Knowledge-Science-Pipeline wissen, ist es sehr schwierig, Knowledge-Science-Projekte durchzuführen. Verstehen Sie additionally zunächst die vollständigen Pipelines.

Wenn Sie die Pipelines verstehen, können nur wir durchgängige, vollständige Knowledge-Science-Projekte durchführen.

In dieser Sitzung erfahren Sie, wie Sie Ordner und Dateien für Finish-to-Finish-Projekte erstellen. Ich versichere Ihnen, dass Sie, wenn Sie dies verstehen, Ordner und Dateistrukturen für jedes Projekt erstellen können.

Als Referenz klicken Sie bitte auf mein GitHub-Repository:

Referenz – https://lnkd.in/gnfGdKgV

1. Erstellen Sie eine virtuelle Umgebung: Virtuelle Umgebung für separate Projekte

2. Erstellen Sie die Datei „Necessities.txt“: So installieren Sie Bibliotheken (z. B. Numpy, Pandas)

3. Erstellen Sie eine setup.py Datei: Immer wenn wir das gesamte Projekt in die Pakete umwandeln wollen

4. Erstellen eines Notizbuchordners: Im Pocket book-Ordner sollten wir einen Datenordner zum Hochladen eines Datensatzes erstellen. Dieser Notizbuchordner wird nicht in das Paket konvertiert, sondern dient nur unseren EDA-Zwecken.
(i) Datenordner
(ii) Daten.csv
(im Datenordner)
(iii) EDA.ipynb
(iv) Modelltraining.ipynb

5. Erstellen eines Quellordners: Mein gesamter Lebenszyklus des maschinellen Lernens sollte in diesem Quellordner ausgeführt werden. Wann immer wir einen Ordner erstellen, sollten wir immer einen erstellen init.py Datei. Da dieser Quellordner auch ein Paket ist, sollten wir ihn wiederverwenden und woanders installieren können.
Wir sollten die folgenden Dateien und Ordner in der Quelldatei erstellen.

(ich) __init__.py – Um diesen Ordner in ein Paket zu konvertieren
(ii) Ausnahme.py – Um die Ausnahmen zu behandeln
(iii) logger.py – Um eine Protokolldatei zu erstellen
(iv) utils.py utils.py Mit „Datei“ ist im Grunde jede generische Funktionalität gemeint, die ich für das gesamte Projekt erstellen möchte.
(v) Komponentenordner
(vi) __init__.py Datei (im Komponentenordner) – Um diesen Komponentenordner in ein Paket zu konvertieren
(vi) data_ingestion.py Datei (im Komponentenordner) – Zum Extrahieren des Datensatzes aus Datenbanken oder anderswo
(vi) data_transformation.py Datei (im Komponentenordner) – Zum Function-Engineering
(vii) model_trainer.py Datei (im Komponentenordner) – Zum Erstellen eines Modells
(ix) Pipeline-Ordner (im Quellordner) – Dieser Ordner dient zum Trainieren des Modells und zur Vorhersage des Modells.
(X) training_pipeline.py Datei (im Pipeline-Ordner) – Bewertung des Modells
(xi) predict_pipeline.py Datei (im Pipeline-Ordner) – Vorhersage für Testdaten oder neue Daten

6. Artefaktordner: Dieser Ordner wird durch Code und nicht manuell erstellt. Dieser Ordner dient zum Speichern unserer Ausgaben.
7. Protokolle – Um die Protokolldetails zu speichern, wird dieser Ordner per Code und nicht manuell erstellt.
8. app.py – Um eine Webanwendung für unser Modell zu erstellen
9. Vorlagenordner
(i) index.html
(ii) kind.html
(iii) outcomes.html

10. Docker-Datei – Zur Bereitstellung in der Cloud.

Als Referenz klicken Sie bitte auf mein GitHub-Repository:

Referenz – https://lnkd.in/gnfGdKgV

Fühlen Sie sich frei, mir Ihre Fragen zu stellen und mich auf die Fehler in meinem Schreiben über through hinzuweisen

LinkedIn: https://www.linkedin.com/in/santhosh-kumar-a98157219

E-Mail: santhoshbharath61@gmail.com

Github: https://github.com/Santhoshgithub22

Okay, entspann dich, wir sehen uns beim nächsten Schreiben bis zum glücklichen Lernen : ) #study_with_santhosh



Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here