Künstliche Intelligenz ist ein Bereich, der so schnell wächst, dass es manchmal schwierig ist, mitzuhalten! ViTs, CNN, GANs, Swin … es kann ziemlich verwirrend sein, zu verstehen, was alle Modelle tun und wann wir sie verwenden können. Heute werden wir untersuchen, was diskriminierende Modelle sind und wie sie sich von generativen Modellen unterscheiden. Wann sollten wir sie verwenden und einige Beispiele.
Wie immer sind diese Technologien ziemlich tiefgreifend; Daher ist es nicht meine Absicht, mich weiter mit ihnen zu befassen. Wenn Sie möchten, dass ich zu einem von ihnen eine tiefergehende Analyse schreibe, lassen Sie es mich in den Kommentaren wissen!
Seit den 1970er Jahren hat der Bereich der KI drei Hauptaufgaben in verschiedenen Kontexten ausgewählt: Klassifizierung, Erkennung und Segmentierung. Lassen Sie mich sie anhand eines Laptop-Imaginative and prescient-Beispiels erklären. Stellen Sie sich vor, wir möchten herausfinden, ob auf dem folgenden Bild ein Hut zu sehen ist.
Wie Sie vielleicht sehen, gibt es je nach gewünschter Genauigkeit mehrere Möglichkeiten, diese Frage zu beantworten. Wenn Sie nur wissen möchten, ob auf dem Bild ein Hut zu sehen ist oder nicht, möchten Sie eine Klassifizierung durchführen; wenn Sie es wissen müssen Wo Können Sie auf diesem Bild einen Hut finden, dann ist die Erkennung (mit Lokalisierung) Ihre Aufgabe; Endlich, wenn Sie es wissen wollen genau wo Ist Ihr Hut (dh welche Pixel entsprechen einem Hut auf dem Bild), dann ist die Segmentierung das, was Sie wünschen.
Diese Aufgaben beschränken sich nicht auf Bilder; Beispielsweise können wir eine Klassifizierung durchführen, um festzustellen, ob ein Kunde für einen Kredit bei einer Financial institution geeignet ist oder nicht, oder wir möchten anhand früherer Suchanfragen in einem Geschäft herausfinden, welche Kunden für eine bestimmte Werbung besser geeignet sind.
Natürlich gibt es noch viele andere berühmte Beispiele wie autonome Navigation, Arzneimittelentwicklung, Gesichtserkennung, generative KI und so weiter; Aber gibt es eine Möglichkeit, diese Algorithmen anhand ihrer Fähigkeiten zu klassifizieren? Was ist mit klassischeren Algorithmen wie der linearen Regression oder Markovian-Ketten?
Letztendlich haben quick alle Modelle das Ziel, die Wahrscheinlichkeit vorherzusagen, dass ein Ereignis eintritt oder zu einer Gruppe gehört. Unter dieser Prämisse können wir die Welt der mathematischen Modellierung in zwei große Gruppen aufteilen: diskriminative und generative Modelle.
Diskriminative Modelle: Eine Grenze finden
Dies sind alle Modelle, die zur statistischen Klassifizierung und zu bedingten Modellen gehören. Sie sind darauf spezialisiert, Grenzen zwischen Klassen oder Bezeichnungen in einem bestimmten Datensatz zu finden. Das Ziel ist die Schaffung eines Funktion, die Eingaben in binäre Ausgaben umwandelt.
Gegeben sei eine Menge von Labels Y und eine Menge von Parametern X, die wir finden wollen die Wahrscheinlichkeitsfunktion „f“ für das Eintreten von Y bei gegebenem X; Genau wie in der klassischen Statistik ist dies P(Y|X). Obwohl sie einfach klingen mögen, sind sie ziemlich wirkungsvoll; Die bekanntesten Algorithmen für diese Aufgabe sind Regressionen, Assist-Vektor-Maschinen, klassische neuronale Netze, nächste Nachbarn, Zufallswälder und bedingte Zufallsfelder.
Diese Modelle sind sturdy gegenüber Ausreißern; Dennoch können sie einen Datenpunkt leicht falsch klassifizieren. Zu den modernen Anwendungen dieser Algorithmen gehören Wettervorhersagen, binäre Klassifizierung, Stimmungsanalyse von Texten und vieles mehr.
Generative Modelle: Finden der Datenstruktur
Wie der Title vermuten lässt, handelt es sich bei generativen Modellen um eine Klasse statistischer Modelle, die auf der Grundlage der Datenverteilung in einem Datensatz neue Dateninstanzen generieren können. Das Ziel dieser Artwork von Algorithmen besteht darin, die zugrunde liegenden Verteilungsmuster der Datenpunkte zu modellieren und ihre Reichweite ist weitaus größer als bei diskriminierenden Modellen. Mit ihnen können Sie eine Wahrscheinlichkeit schätzen, Datenpunkte modellieren, ein Phänomen in Daten beschreiben und auch eine Klassifizierung ausschließlich auf der Grundlage von Wahrscheinlichkeiten durchführen.
Das Kernprinzip dieser Modelle ist das Bayes-Theorem; Daher zielt das Coaching der Algorithmen darauf ab, eine Funktion abzuschätzen f: X nach Y in dem Daten die Parameter bereitstellen P(X|Y) und P(Y) Wir können additionally den Bayes-Satz zur Berechnung verwenden P(Y|X) in dem es Folgendes heißt:
Die bekanntesten Algorithmen aus dieser Kategorie sind: Naive Bayes, Ok-Means, Markov-Ketten, Hidden-Markov-Modelle, Generative Adversarial Networks, autoregressive Modelle und viele mehr. Möglicherweise haben Sie einige glamouröse Beispiele wie die LLMs wie chatGPT oder die Bildgeneratoren Steady Diffusion oder DALL-E gesehen.
Das nächste Bild ist ein Klassiker zur Beschreibung des Unterschieds zwischen den beiden Modellklassen:
Intestine gemacht, jetzt haben Sie Grundwissen über die Ziele von KI-Algorithmen; Bis zu diesem Punkt sollten Sie die Unterschiede zwischen diskriminierenden und generativen Modellen sowie einige gängige Anwendungen kennen.
Welchen Algorithmus möchten Sie näher erläutern? Lass es mich in den Kommentaren wissen und vergiss nicht, mir zu folgen, um mehr Inhalte wie diesen zu erhalten.