Der Binomialverteilung ist eine weit verbreitete statistische Verteilung, mit der Datenwissenschaftler vertraut sein sollten, da sie in zahlreichen Zusammenhängen auftritt. Ein bemerkenswertes Beispiel ist seine Anwendung in überwachtes Lernen Probleme zur Klassifizierung, bei denen die Verlustfunktion, die Kreuzentropieverlust, wird aus der Binomialverteilung abgeleitet. In diesem Beitrag werden wir die Instinct, Theorie und Beispiele im Zusammenhang mit dieser Verteilung untersuchen.
Die Binomialverteilung ist a diskrete Verteilung Dies misst die Wahrscheinlichkeit, in einer bestimmten Anzahl von Versuchen eine bestimmte Anzahl von Erfolgen zu erzielen. Es kann beispielsweise die Frage beantworten: „Wie groß ist die Wahrscheinlichkeit, bei 5 Münzwürfen 2 Köpfe zu erhalten?“ In diesem Zusammenhang stellt jeder Versuch entweder einen Erfolg (Münze landet auf Kopf) oder einen Misserfolg (Münze landet auf Zahl) dar. Diese Einzelversuche werden als a bezeichnet Bernoulli-Prozess oder -ProzessSwobei jeder Versuch im Wesentlichen eine binäre (Ja-Nein)-Frage stellt.
Sie können sehen, dass die Wahrscheinlichkeit eines Erfolgs beträgt PDaher besteht eine Wahrscheinlichkeit von 1-p aufgrund seiner binären Natur ein Fehlschlag. Folglich ist die Wahrscheinlichkeitsmassenfunktion (PMF) nimmt folgende Kind an:
Wo X ist eine Zufallsvariable aus der Bernoulli-Verteilung und okay ist das Ergebnis des Prozesses. Beachten Sie, wie wenn okay=1, dann ist die Wahrscheinlichkeit gerecht P.
Die Binomialverteilung ist eine Kombination von Bernoulli-Versuchen mit einer gegebenen Anzahl von Erfolgen, okay. Um die binomiale PMF abzuleiten, beziehen wir beide ein Binomialkoeffizient und die Anzahl der Versuche, Nin das Bernoulli PMF:
Im Allgemeinen gibt es Bedingungen für die Binomialverteilung:
- Anzahl von Versuchen, NIst repariert
- Jeder Versuch ist unabhängig
- Jeder Versuch hat zwei Ergebnisse
- Die Wahrscheinlichkeit eines Erfolgs, Pist für jeden Versuch gleich
Kehren wir zu der Frage zurück, die wir zuvor gestellt haben: „Wie groß ist die Wahrscheinlichkeit, bei 5 Münzwürfen 2 Köpfe zu erhalten?“
Beachten Sie, dass die Wahrscheinlichkeit, zwei Köpfe zu erhalten, relativ gering ist. Es ist wichtig zu bedenken, dass dies die Wahrscheinlichkeit für genau 2 Köpfe ist. Daher gibt es zusätzliche Möglichkeiten, bei denen drei, vier oder sogar fünf Köpfe vorkommen.
Um ein tieferes Verständnis zu erlangen, visualisieren wir die Wahrscheinlichkeitsverteilung, indem wir sie als Funktion der Anzahl der Erfolge grafisch darstellen. Im Wesentlichen werden wir die Wahrscheinlichkeitsmassenfunktion (PMF) anzeigen.
Wir beobachten, dass das wahrscheinlichste Ergebnis oder der erwartete Wert 0,5 ist, was Sinn macht. Bemerken Sie jedoch weitere Merkmale in Bezug auf? Kind der Verteilung? Wie wäre es, wenn wir es für 50 Versuche aufzeichnen würden:
Beachten Sie, wie es zunehmend einem ähnelt Normalverteilung. Dieses Phänomen wird als bezeichnet Zentraler Grenzwertsatz! Der zentrale Grenzwertsatz besagt, dass die Verteilung mit zunehmender Stichprobengröße zu einer Normalverteilung tendiert.
Verknüpfung Hier für einen Artikel, der den zentralen Grenzwertsatz ausführlicher erklärt
In diesem Blogbeitrag haben wir die Binomialverteilung untersucht. Diese diskrete Verteilung berechnet die Wahrscheinlichkeit, innerhalb einer bestimmten Anzahl von Versuchen eine bestimmte Anzahl von Erfolgen zu erzielen. Die binomiale Wahrscheinlichkeitsverteilung findet in verschiedenen Branchen Anwendung, darunter Rohstoffhandel, Versicherungen und Lieferkettenbetriebe. Daher ist es für Datenwissenschaftler ein wertvolles Konzept, sich dessen bewusst zu sein.
Der vollständige Code ist hier auf meinem GitHub verfügbar:
(Alle Emojis entworfen von OpenMoji – das Open-Supply-Emoji- und Icon-Projekt. Lizenz: CC BY-SA 4.0)