Deteksi Dini Penyakit Diabetes Menggunakan Algorithmus Maschinelles Lernen: Studi Kasus Pada Dataset Pima Indian Diabetes | von Sherly Ekaputri | Juni 2023

0
24


Lernen Sie maschinelles Lernen kennen

Maschinelles Lernen ist eine Kombination aus künstlicher Intelligenz und vielen anderen Methoden, um Daten zu sammeln und zu verarbeiten. Konsep dasarnya adalah mesin akan belajar and beradaptasi melalui pengalaman. Penelitian hat sich darauf konzentriert, maschinelles Lernen zu nutzen, um die benötigte Menge an Daten zu sammeln und zu speichern.

Maschinelles Lernen in Tahapan

  1. Pengumpulan-Daten
    Ich habe hier wichtige Daten gesammelt, die für die Arbeit related sind.
  2. Pemahaman-Daten
    Dies ist jedoch der Fall, da die Daten nur dann angezeigt werden, wenn Sie weitere Informationen zu diesem Thema erhalten.
  3. Pembersihan-Daten
    Dies bedeutet, dass ich keine Daten mehr lesen muss, um sie zu lesen, oder dass ich mir die Daten nicht mehr ansehen kann.
  4. Analysedaten Eksplorasi
    Ich habe diese Daten sorgfältig ausgewertet, um die Daten zu überprüfen und zu überprüfen, ob dies der Fall ist oder nicht.
  5. Pembuatan-Modell
    Dies ist jedoch der Fall, wenn das Modell maschinelles Lernen die erforderlichen Daten auswertet.
  6. Bewertung
    Ich habe die Methode des maschinellen Lernens ausgewertet, um sie bei der Bewertung meiner Anforderungen zu verbessern.

Der Datensatz „Pima Indian“ wurde vor 21 Jahren erstellt. Die Daten wurden vom Nationwide Institute of Diabetes and Digestive and Kidney Ailments erstellt.

Variable Independen (X), die aus dem folgenden Datensatz besteht:

  1. Schwangerschaften: Sie können sich keine Sorgen machen, dass sie nicht schwanger werden.
  2. Glukose: Konsentrasi glukosa dalam plasma selama tes toleransi glukosa selama 2 jam.
  3. Blutdruck: Der Blutdruck ist diastolisch und die Blutdruckmessung ist nicht ausreichend.
  4. Hautdicke: Die Dicke der Haut verringert sich, bis die Dicke der Haut erreicht ist.
  5. Insulin: Kadar Insulinserum Setelah 2 Jam.
  6. BMI (Physique-Mass-Index): Indikator, der die Wahrscheinlichkeit erhöht, dass die Gesundheit verbessert wird.
  7. Diabetes-Stammbaumfunktion: Indikator für Diabetes aufgrund der Krankheit.
  8. Alter: Usia dalam tahun.

Variable abhängig (Y):

Ergebnis: Variabel kelas dengan nilai (0,1); 0 für Nicht-Diabetes und 1 für nicht-Diabetes.

Bibliotheken importieren

Es ist nicht einfach, maschinelles Lernen zu nutzen, um die Verwendung eines Python-Moduls zu verbessern.

Daten lesen

Die Ausgabe erfolgt über 768 Bars und 9 Koloms, davon 8 unabhängige Variablen und 1 abhängige Variable. Ukuranische Daten: Menüs, die alle verfügbaren Daten enthalten. Mit 768 Bars und 9 Kolomen werden die Daten nicht mehr benötigt und die Daten werden nicht mehr angezeigt. Informative Daten: Sie können Informationen über die Artwork der Daten sammeln, indem Sie sie (unabhängig von der Variable) und das Ziel (abhängig von der Variable) anpassen. Variable Independen (X): Termasuk Pregnancies, Glucose, BloodPressure, SkinThickness, InsulinDan Age, mit Typ-Integer-Daten. Variabel BMI Dan DiabetesPedigreeFunction Memiliki-Tipp für Datenfloat. Variable abhängig (Y): Consequence Memiliki-Typdaten-Ganzzahl (0,1). Beschreibung der Daten: Statistiken und Verteilungsdaten anzeigen. Folgende Informationen werden normalerweise benötigt:

  • Glukose: Nilai <140 mg/dL, wenn der Wert regular ist, kann eine Prädiabetes-Erkrankung mit einem Wert von 140–199 mg/dL erreicht werden.
  • Blutdruck: Nilai <80 mmHg.
  • Hautdicke: Nilai antara 15–23 mm.
  • Insulin: Nilai Antara 5–15 Mikro IE/ml. Die von Mitgliedern verteilten Statistiken umfassen Informationen zur Speicherung von Datenanalysen:
  • Nilai tertinggi pada variabel Pregnancies Ab 17 Jahren ist das Menü mit dem 17. Lebensjahr ausgestattet.
  • Nilai maximales Pada variabel SkinThickness Durchmesser 99 mm. Wenn die Fettleibigkeit verloren geht, beträgt die normale Dicke 15–23 mm.
  • Terdapat-Ausreißer-Pada-Variable Glucose, BloodPressure, Insulin, BMIDan SkinThickness 0,00 €. In diesem Menü sind 0,00 € gültig, 0,00 €, 0,00 €, 0,00 €, 0,00 €, 0,00 €, 0,00 €, 0,00 €, 0,00 €, 00,00 €

A. Ein Ausreißer wird nicht erkannt, wenn ein Ausreißer auftritt Glucose, BloodPressure, Insulin, BMIDan SkinThicknessKita perlu memilih methode imputasi untuk ngatasi outlier tersebut, daripada menghapusnya.

Der Ausreißer wurde in diesem Datensatz gefunden. Dies ist jedoch nicht der Fall, weil der Ausreißer aufgrund der fehlenden Medianwerte ermittelt werden muss, und der Median wird nicht als sensibel eingestuft. Dies bedeutet, dass dies nicht der Fall ist, da die Ergebnisse kurz und bündig sind und die Schätzungen, die sie erhalten, nicht berücksichtigt werden können.

Dies ist jedoch nicht der Fall, da die Ausreißer nur dann verwendet werden können, wenn die Ausreißer automatisch gelöscht werden.

B. Pemeriksaan Fehlender Wert
Fehlender Wert aufgrund von Eingabedaten. Untungnya, dataset kita tidak memiliki fehlender Wert.

C. Pemeriksaan Knowledge Duplikat
Ich habe mir die Mühe gemacht, die Daten zu speichern und sie mit dem Datensatz zu verdoppeln.

Dies ist jedoch nicht der Fall, da die Analyse der von Ihnen benötigten Daten erforderlich ist.

Die Zielverteilung ist variabel end result sebagai goal, kita akan menganalisis distribusi goal tersebut.

Der Vertrieb von Geräten ist in diesem Fall ein Kinderspiel, das von einem unabhängigen Anbieter vertrieben werden kann.



Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here