Da die Sigmoidfunktion im Fall der binären Klassifizierung die grundlegende Funktion ist und der einzige Teil des Algorithmus, der sie von der linearen Regression unterscheidet, konzentrieren wir uns auf ihre Formel. Die Funktion führt zu einem S-förmigen Diagramm mit einem Wertebereich von 0 bis 1 für einen Wertebereich von negativ unendlich bis positiv unendlich. Dies bedeutet, dass die aus der Sigmoidfunktion resultierende Ausgabe immer zwischen 1 und 0 liegt. Dies ist für uns nützlich, da im Falle einer binären Klassifizierung der aus der Sigmoidfunktion erhaltene Wert die Wahrscheinlichkeit der Zugehörigkeit zu einer bestimmten Klasse darstellt.
Sie können mit verschiedenen x-Werten experimentieren und den Graphen der Sigmoidfunktion mithilfe des On-line-Rechners beobachten Hier die auch zur Erstellung der obigen Grafiken verwendet wurde.
Der aus dieser Funktion erhaltene Wert zwischen 0 und 1 ist die Wahrscheinlichkeit, die durch Multiplikation mit 100 in einen Prozentwert umgewandelt werden kann.
Ein Schwellenwert ist ein Wert, den wir bei der Klassenbestimmung festlegen. Wenn wir eine Sigmoidfunktion über dem Schwellenwert erhalten, würden wir dies als positives Ergebnis betrachten, und wenn sie kleiner als der Schwellenwert ist, betrachten wir sie als negatives Ergebnis.
Warum machen wir das? Lassen Sie es uns anhand eines Beispiels verstehen. Angenommen, wir erstellen ein Modell, das klassifiziert, ob es sich bei einem Blatt um ein Ahornblatt oder ein Kiefernblatt handelt. Wir verarbeiten die Daten und setzen die Modellausgabe auf 1, wenn das Blatt Mapple ist, andernfalls auf 0. Nun gibt ein logistisches Regressionsmodell einen Wert zwischen 0 und 1 aus. In den meisten Fällen gibt es möglicherweise keine eindeutige 1 oder 0 aus. Hier kommt der Schwellenwert ins Spiel, der Wert über einem Schwellenwert (am häufigsten 0,5). werden als 1 und Werte unterhalb des Schwellenwerts als 0 betrachtet. Dies sind die Werte, die für uns von Bedeutung sind.
Die Entscheidungsgrenze ist die Linie/Kurve, die verschiedene Klassen voneinander trennt. Das Modell verwendet diese Linie, um zwischen den verfügbaren Klassen zu unterscheiden. In unserem Fall wird die Entscheidungsgrenze mithilfe der Sigmoidfunktion erstellt. Zur Definition der Entscheidungsgrenze wird häufig der Schwellenwert 0,5 verwendet, dieser kann jedoch variieren. Die Entscheidungsgrenze unterscheidet sich von der Sigmoidfunktion in dem Sinne, dass die Sigmoidfunktion Wahrscheinlichkeiten dafür ausgibt, dass ein Datensatz zu einer Klasse gehört, während die Entscheidungsgrenze die Linie zeichnet, die die Klassen trennt.
Hierbei ist zu beachten, dass bei der binären Klassifizierung mit logistischer Regression bei zwei Merkmalen die Entscheidungsgrenze eine gerade Linie ist. Dies liegt daran, dass die Merkmale normalerweise nicht transformiert werden. Aber wenn wir komplexe/transformierte Funktionen verwenden Zum Beispiel : Wenn wir Options bei der Konvertierung in einen Polynomtyp verwenden, nimmt die Entscheidungsgrenze zwangsläufig unterschiedliche Formen an, z. B. eine Kurve, eine Ellipse oder sogar sehr komplexe Formen, wenn die Polynompotenzen hoch sind.
Sehen wir uns verschiedene Entscheidungsgrenzentypen in einem Beispiel an, in dem der logistische Regressionsalgorithmus verwendet wird, um zu bestimmen, ob es sich bei einem Blatt um ein Ahornblatt oder ein Kiefernblatt handelt.
Lassen Sie uns die obige Abbildung verstehen. Beide Achsen stehen für zwei vermeintliche Merkmale, die wir für unsere Probleme verwendet haben. Die erste ist eine gerade Entscheidungsgrenzlinie, die sich aus den beiden Merkmalen ergibt. Wenn wir die Merkmale in Polynome umwandeln, werden die Entscheidungsgrenzen unterschiedlich sein. Das Quadrieren der Merkmale kann zu einer Kurve führen, wie in der Abbildung oben rechts gezeigt, und eine weitere Transformation Merkmale können zu unterschiedlichen Formen führen, wie in den unteren Diagrammen dargestellt.
Obwohl es überhaupt nicht notwendig ist, Gleichungen und daraus resultierende Diagramme zu verstehen, um Konzepte des maschinellen Lernens zu erlernen, könnte es ein interessantes Thema zum Lernen sein und dazu beitragen, eine sehr solide Grundlage für einige Konzepte in ML zu schaffen. Wenn Ihr Interesse geweckt wird, wäre es daher eine gute Quelle, die Khan Academy zu besuchen Algebra-LernpfadSobald Sie damit fertig sind, verfügen Sie über ein tiefes Verständnis dafür, wie sich unterschiedliche Exponentialwerte auf Linienformen auswirken. Wenn Sie nicht bereit sind, den gesamten Weg durchzugehen, können Sie nur die wenigen Kapitel lernen, in denen Diagramme und Gleichungen erwähnt werden.