1. Probleme und Ziele
Das Downside, das ich lösen muss, ist, dass wir die Lösung nicht vorher geschrieben haben, weil wir den Algorithmus kennengelernt haben Polynomiale Regression. Portanto, SUnd Sie wissen nicht, was Sie tun müssen, und wissen nicht, in welchem Kontext Sie sich befinden Artigo da regressão polinomial. Da ich jedoch noch nicht in der Lage conflict, das Downside schnell zu lösen, folge ich einer Zusammenfassung dessen, was ich tun möchte:
- Wir haben es nicht geschafft Datensatz die Frachten und ihre jeweiligen Salários anuais;
- Ö Datensatz (imagem abaixo) é formatado pela coluna Place (Nome do Cargo), Eben (Nível do Cargo) e Gehalt (Salário do Cargo). Eine Liste von vielen Enterprise Analyst aß CEO;
3. Dieses Ziel bestimmt den Wert des Frachtgehalts einer Frachtfiktion, die zwischen Stufe 6 und Stufe 7 bzw. dem Gehalt der Fracht auf Stufe 6.5 liegt.
4. Für diesen Fall müssen Sie ein Modell erstellen maschinelles Lernen (kein artigo de hoje será o Entscheidungsbaum) que se juste aos dados do Datensatz Sie müssen feststellen, ob es sich um ein Gehalt handelt.
Ich habe kein Downside mehr, weil ich im Falle einer Verzweiflung davon überzeugt bin, dass du vor Kurzem zurückgekehrt bist.
Vamos agora entender o modelo que queremos implementierenar.
2. Einführung
Um unser Downside mit der Gehaltsdefinition zu lösen, müssen wir einen Algorithmus verwenden maschinelles Lernen Chamado Entscheidungsbaum-Regressionoder auf Portugiesisch, Der Entscheidungsfindungsantrag wurde auf die Regression angewendet (wird auf die Regression angewendet, weil er auch bei Klassifizierungsproblemen verwendet werden kann).
Der Identify „Arvore“ der Entscheidung conflict so groß, dass Ihr Diagramm den Aspekt eines sehr schwierigen Aspekts mit einem Arvore darstellte (abgebildete Abbildung).
Als Ergebnis des Bildes wurde ein Entscheidungsbaum aus zwei wesentlichen Teilen gebildet: Dies sind die folgenden (nickt) e als folhas (Blätter). Da sich vor der Entscheidung zwei Elemente befinden, trennen Sie die Daten nicht mehr von ihnen (binäre Klassifizierung) und gehen Sie im Folgenden an die nächsten Schritte vorbei. Wenn wir wissen, dass sie zwischendurch ein hohes Maß an Qualität haben, dann sind die Eigenschaften gleich, ohne dass eine Einstufung erforderlich ist, oder weil alle mit dem Wert verschiedener unabhängiger Personen, ohne Regression, zu kämpfen haben Das sind die Dinge, die man tun muss, und sie müssen nicht mehr getrennt werden. Es ist eine grundlegende Idee eines Algorithmus Entscheidungsbaum.
Das Ziel dieses Artikels besteht darin, keine Einzelheiten zu erläutern, sondern den in der Bibliothek verwendeten Algorithmus zu implementieren oder zu verwenden sciki-lernen. Wichtig ist, dass Sie daran interessiert sind, uns anzumelden und mehr darüber zu erfahren, wie Sie vor der Entscheidungsfindung arbeiten, und Sie bitten, Ihnen bei der Videoaufnahme behilflich zu sein Normalisierter Nerd ohne YouTube. Ich hatte eine besondere Lehrzeit und wollte viel darüber wissen, was wir hier tun.
Da es sich um eine kurze Erklärung handelt, sind wir für die Implementierung des Algorithmus verantwortlich.
3. Importando as Bibliotecas
Als Kostüm, ich habe sie als Numpy-, Matplotlib- und Pandas-Bibliotheken importiert. Zu Beginn conflict es aber auch wichtig, Sckit-Be taught zu lernen, aber das ist nicht nötig.
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
4. Importieren Sie den Datensatz
Bitte beachten Sie, dass Sie die Gehaltsdaten, die Sie benötigen, nicht importieren können. Zu diesem Zweck, wie in der Praxis, verwenden wir Pandas für den Import.
Aqui também separamos o Datensatz in verschiedenen unabhängigen (X) und abhängige Variable (j).
dataset = pd.read_csv('Position_Salaries.csv')X = dataset.iloc[:, 1:-1].values
y = dataset.iloc[:, -1].values
Ich muss mich auf den Prozess konzentrieren, es ist sehr wichtig, dass wir uns für die Ausübung meines Lebens entscheiden müssen. Devido ao tamanho diminuto desse Datensatz (ca. 10 Brücken), wir mussten uns nicht von der Ausbildungsstätte und den Testhäfen trennen. Eine einfache Einteilung von Ihnen Datensatz Dessa Magnitude Levaria a resultados pessimos.
Aus diesem Grund haben wir uns nach der Implementierung nicht um die Leistung gekümmert.
5. Erstellen Sie das Entscheidungsbaum-Regressionsmodell im gesamten Datensatz
Zum Trainieren des Modells muss eine Klasse importiert werden DecisionTreeRegressor da biblioteca sckilearn.tree Wir verwenden nur die Methode match Zur Einführung der Übungstermine.
Der angegebene Code:
from sklearn.tree import DecisionTreeRegressorregressor = DecisionTreeRegressor(random_state=0)
regressor.match(X, y)
6. Prevendo um Novo Resultado
Wir verwenden das Modell, das wir bauen müssen, bevor wir den Mut verlieren. Als Nächstes versuchen wir, den Wert einer Ladung zu ermitteln, die zwischen den Stufen 6 und 7 oder in der Folge auf Stufe 6.5 liegt.
Verwendung der Methode vorhersagen NEIN Regressorobtemos:
print(regressor.predict([[6.5]]))# Output:
# [150000.]
Da wir keinen Code erhalten haben, hat unser Modell einen Wert von 150.000 US-Greenback gefunden.
Vielleicht ist es falsch, dass der Kandidat darauf achtet?
Aufgrund dieser Informationen besteht keine Möglichkeit, den Kandidaten zu bestätigen oder zu bestätigen.
Como o salário do nivel 6 (Regionsmanager) im Alter von 150.000 US-Greenback, ab Stufe 7 (Accomplice) Ära 200.000 US-Greenback professional Kandidat, der vor 2 Jahren als Bewerber gearbeitet hat Regionsmanager, Es ist wahrscheinlich, dass dieser Unterschied bis zum letzten Schicksalsschlag erfolgt. Es gibt keine Gewissheit, aber es ist ein Hinweis.
Das ist eine Erklärung, wir werden sehen, wie unser Modell aussieht.
7. Visualisieren Sie die Ergebnisse des Entscheidungsfindungsmodells
Komm oder tu es matplotlibWir haben überprüft, ob unser Modell genau richtig ist.
Der für die grafische Darstellung verwendete Code kann übertragen werden:
fig, ax = plt.subplots(1, 1, figsize=(10, 6))X_grid = np.arange(min(X), max(X), 0.1)
X_grid = X_grid.reshape(len(X_grid), 1)
ax.plot(X_grid, regressor.predict(X_grid), coloration = 'blue')
ax.scatter(X, y, coloration='pink')
ax.set_title('Verdade ou Blefe (Árvore de Decisão)')
ax.set_xlabel('Place Degree')
ax.set_ylabel('Salário (US$)')
Das Ergebnis ist auf jeden Fall sehr interessant. Passen Sie das Modell so an, dass es sich um einen Aspekt handelt: Jedes Mal, wenn die Zugbrücken eine Kurve bilden, um sie zu entgrauen. Dieses Verhalten ist gerechtfertigt, weil das Modell eine einzige Gehaltswürdigkeit für jedes neue Jahr verlangt, bis es zu einem Übergang auf die nächste Stufe und abrupt zum Abgang kommt.
Als Beispiel: Das Modell der Stufe 6 oder 6,5 hat ein Gehalt von 150.000 US-Greenback erhalten. Nein, es liegt kein Gehalt über 200.000 US-Greenback vor.
8. Fazit
Usando o mesmo Datensatz In den letzten Jahren antwortete ich auf das Downside, dass der Kandidat gerade darauf bedacht conflict oder kein Gehalt für das Unternehmen hatte, das er zu arbeiten hatte. Unglücklicherweise, so wie ich es in den letzten Jahren gesehen habe, ist es einfach, die Tapferkeit unseres Modells zu erlangen (und es ist eine andere Tapferkeit, die der Falschbesetzung des Kandidaten entspricht). Es wird nicht angezeigt, dass der Kandidat nicht erwähnt wird oder nicht. Precisaríamos de outros elementos para afirmar isso.
Ich konnte von Anfang an nicht darauf antworten, oder wir haben die Möglichkeit, verschiedene Vorstellungen von der Entscheidungsfindung und ihrer Implementierungsnummer zu verstehen scikit-lernen.
Kurz bevor wir einen neuen Algorithmus implementiert haben, der diese implementiert: o Zufälliger Wald.
Até lá.