Lernen Sie maschinelles Lernen kennen
Maschinelles Lernen ist eine Kombination aus künstlicher Intelligenz und vielen anderen Methoden, um Daten zu sammeln und zu verarbeiten. Konsep dasarnya adalah mesin akan belajar and beradaptasi melalui pengalaman. Penelitian hat sich darauf konzentriert, maschinelles Lernen zu nutzen, um die benötigte Menge an Daten zu sammeln und zu speichern.
Maschinelles Lernen in Tahapan
- Pengumpulan-Daten
Ich habe hier wichtige Daten gesammelt, die für die Arbeit related sind. - Pemahaman-Daten
Dies ist jedoch der Fall, da die Daten nur dann angezeigt werden, wenn Sie weitere Informationen zu diesem Thema erhalten. - Pembersihan-Daten
Dies bedeutet, dass ich keine Daten mehr lesen muss, um sie zu lesen, oder dass ich mir die Daten nicht mehr ansehen kann. - Analysedaten Eksplorasi
Ich habe diese Daten sorgfältig ausgewertet, um die Daten zu überprüfen und zu überprüfen, ob dies der Fall ist oder nicht. - Pembuatan-Modell
Dies ist jedoch der Fall, wenn das Modell maschinelles Lernen die erforderlichen Daten auswertet. - Bewertung
Ich habe die Methode des maschinellen Lernens ausgewertet, um sie bei der Bewertung meiner Anforderungen zu verbessern.
Der Datensatz „Pima Indian“ wurde vor 21 Jahren erstellt. Die Daten wurden vom Nationwide Institute of Diabetes and Digestive and Kidney Ailments erstellt.
Variable Independen (X), die aus dem folgenden Datensatz besteht:
- Schwangerschaften: Sie können sich keine Sorgen machen, dass sie nicht schwanger werden.
- Glukose: Konsentrasi glukosa dalam plasma selama tes toleransi glukosa selama 2 jam.
- Blutdruck: Der Blutdruck ist diastolisch und die Blutdruckmessung ist nicht ausreichend.
- Hautdicke: Die Dicke der Haut verringert sich, bis die Dicke der Haut erreicht ist.
- Insulin: Kadar Insulinserum Setelah 2 Jam.
- BMI (Physique-Mass-Index): Indikator, der die Wahrscheinlichkeit erhöht, dass die Gesundheit verbessert wird.
- Diabetes-Stammbaumfunktion: Indikator für Diabetes aufgrund der Krankheit.
- Alter: Usia dalam tahun.
Variable abhängig (Y):
Ergebnis: Variabel kelas dengan nilai (0,1); 0 für Nicht-Diabetes und 1 für nicht-Diabetes.
Bibliotheken importieren
Es ist nicht einfach, maschinelles Lernen zu nutzen, um die Verwendung eines Python-Moduls zu verbessern.
Daten lesen
Die Ausgabe erfolgt über 768 Bars und 9 Koloms, davon 8 unabhängige Variablen und 1 abhängige Variable. Ukuranische Daten: Menüs, die alle verfügbaren Daten enthalten. Mit 768 Bars und 9 Kolomen werden die Daten nicht mehr benötigt und die Daten werden nicht mehr angezeigt. Informative Daten: Sie können Informationen über die Artwork der Daten sammeln, indem Sie sie (unabhängig von der Variable) und das Ziel (abhängig von der Variable) anpassen. Variable Independen (X): Termasuk Pregnancies
, Glucose
, BloodPressure
, SkinThickness
, Insulin
Dan Age
, mit Typ-Integer-Daten. Variabel BMI
Dan DiabetesPedigreeFunction
Memiliki-Tipp für Datenfloat. Variable abhängig (Y): Consequence
Memiliki-Typdaten-Ganzzahl (0,1). Beschreibung der Daten: Statistiken und Verteilungsdaten anzeigen. Folgende Informationen werden normalerweise benötigt:
- Glukose: Nilai <140 mg/dL, wenn der Wert regular ist, kann eine Prädiabetes-Erkrankung mit einem Wert von 140–199 mg/dL erreicht werden.
- Blutdruck: Nilai <80 mmHg.
- Hautdicke: Nilai antara 15–23 mm.
- Insulin: Nilai Antara 5–15 Mikro IE/ml. Die von Mitgliedern verteilten Statistiken umfassen Informationen zur Speicherung von Datenanalysen:
- Nilai tertinggi pada variabel
Pregnancies
Ab 17 Jahren ist das Menü mit dem 17. Lebensjahr ausgestattet. - Nilai maximales Pada variabel
SkinThickness
Durchmesser 99 mm. Wenn die Fettleibigkeit verloren geht, beträgt die normale Dicke 15–23 mm. - Terdapat-Ausreißer-Pada-Variable
Glucose
,BloodPressure
,Insulin
,BMI
DanSkinThickness
0,00 €. In diesem Menü sind 0,00 € gültig, 0,00 €, 0,00 €, 0,00 €, 0,00 €, 0,00 €, 0,00 €, 0,00 €, 0,00 €, 00,00 €
A. Ein Ausreißer wird nicht erkannt, wenn ein Ausreißer auftritt Glucose
, BloodPressure
, Insulin
, BMI
Dan SkinThickness
Kita perlu memilih methode imputasi untuk ngatasi outlier tersebut, daripada menghapusnya.
Der Ausreißer wurde in diesem Datensatz gefunden. Dies ist jedoch nicht der Fall, weil der Ausreißer aufgrund der fehlenden Medianwerte ermittelt werden muss, und der Median wird nicht als sensibel eingestuft. Dies bedeutet, dass dies nicht der Fall ist, da die Ergebnisse kurz und bündig sind und die Schätzungen, die sie erhalten, nicht berücksichtigt werden können.
Dies ist jedoch nicht der Fall, da die Ausreißer nur dann verwendet werden können, wenn die Ausreißer automatisch gelöscht werden.
B. Pemeriksaan Fehlender Wert
Fehlender Wert aufgrund von Eingabedaten. Untungnya, dataset kita tidak memiliki fehlender Wert.
C. Pemeriksaan Knowledge Duplikat
Ich habe mir die Mühe gemacht, die Daten zu speichern und sie mit dem Datensatz zu verdoppeln.
Dies ist jedoch nicht der Fall, da die Analyse der von Ihnen benötigten Daten erforderlich ist.
Die Zielverteilung ist variabel end result
sebagai goal, kita akan menganalisis distribusi goal tersebut.
Der Vertrieb von Geräten ist in diesem Fall ein Kinderspiel, das von einem unabhängigen Anbieter vertrieben werden kann.