Entschlüsselung der Binomialverteilung: Ein grundlegendes Konzept für Datenwissenschaftler | von Egor Howell | Juni 2023

0
25


Die Grundbausteine ​​der Binomialverteilung verstehen

Foto von Chris Briggs An Unsplash

Der Binomialverteilung ist eine weit verbreitete statistische Verteilung, mit der Datenwissenschaftler vertraut sein sollten, da sie in zahlreichen Zusammenhängen auftritt. Ein bemerkenswertes Beispiel ist seine Anwendung in überwachtes Lernen Probleme zur Klassifizierung, bei denen die Verlustfunktion, die Kreuzentropieverlust, wird aus der Binomialverteilung abgeleitet. In diesem Beitrag werden wir die Instinct, Theorie und Beispiele im Zusammenhang mit dieser Verteilung untersuchen.

Die Binomialverteilung ist a diskrete Verteilung Dies misst die Wahrscheinlichkeit, in einer bestimmten Anzahl von Versuchen eine bestimmte Anzahl von Erfolgen zu erzielen. Es kann beispielsweise die Frage beantworten: „Wie groß ist die Wahrscheinlichkeit, bei 5 Münzwürfen 2 Köpfe zu erhalten?“ In diesem Zusammenhang stellt jeder Versuch entweder einen Erfolg (Münze landet auf Kopf) oder einen Misserfolg (Münze landet auf Zahl) dar. Diese Einzelversuche werden als a bezeichnet Bernoulli-Prozess oder -ProzessSwobei jeder Versuch im Wesentlichen eine binäre (Ja-Nein)-Frage stellt.

Sie können sehen, dass die Wahrscheinlichkeit eines Erfolgs beträgt PDaher besteht eine Wahrscheinlichkeit von 1-p aufgrund seiner binären Natur ein Fehlschlag. Folglich ist die Wahrscheinlichkeitsmassenfunktion (PMF) nimmt folgende Kind an:

Gleichung in LaTex vom Autor.

Wo X ist eine Zufallsvariable aus der Bernoulli-Verteilung und okay ist das Ergebnis des Prozesses. Beachten Sie, wie wenn okay=1, dann ist die Wahrscheinlichkeit gerecht P.

Die Binomialverteilung ist eine Kombination von Bernoulli-Versuchen mit einer gegebenen Anzahl von Erfolgen, okay. Um die binomiale PMF abzuleiten, beziehen wir beide ein Binomialkoeffizient und die Anzahl der Versuche, Nin das Bernoulli PMF:

Gleichung in LaTex vom Autor.

Im Allgemeinen gibt es Bedingungen für die Binomialverteilung:

  • Anzahl von Versuchen, NIst repariert
  • Jeder Versuch ist unabhängig
  • Jeder Versuch hat zwei Ergebnisse
  • Die Wahrscheinlichkeit eines Erfolgs, Pist für jeden Versuch gleich

Kehren wir zu der Frage zurück, die wir zuvor gestellt haben: „Wie groß ist die Wahrscheinlichkeit, bei 5 Münzwürfen 2 Köpfe zu erhalten?“

Die Gleichung in LaTex vom Autor.

Beachten Sie, dass die Wahrscheinlichkeit, zwei Köpfe zu erhalten, relativ gering ist. Es ist wichtig zu bedenken, dass dies die Wahrscheinlichkeit für genau 2 Köpfe ist. Daher gibt es zusätzliche Möglichkeiten, bei denen drei, vier oder sogar fünf Köpfe vorkommen.

Um ein tieferes Verständnis zu erlangen, visualisieren wir die Wahrscheinlichkeitsverteilung, indem wir sie als Funktion der Anzahl der Erfolge grafisch darstellen. Im Wesentlichen werden wir die Wahrscheinlichkeitsmassenfunktion (PMF) anzeigen.

GitHub Gist vom Autor.
Vom Autor in Python erstellte Handlung.

Wir beobachten, dass das wahrscheinlichste Ergebnis oder der erwartete Wert 0,5 ist, was Sinn macht. Bemerken Sie jedoch weitere Merkmale in Bezug auf? Kind der Verteilung? Wie wäre es, wenn wir es für 50 Versuche aufzeichnen würden:

Vom Autor in Python erstellte Handlung.

Beachten Sie, wie es zunehmend einem ähnelt Normalverteilung. Dieses Phänomen wird als bezeichnet Zentraler Grenzwertsatz! Der zentrale Grenzwertsatz besagt, dass die Verteilung mit zunehmender Stichprobengröße zu einer Normalverteilung tendiert.

Verknüpfung Hier für einen Artikel, der den zentralen Grenzwertsatz ausführlicher erklärt

In diesem Blogbeitrag haben wir die Binomialverteilung untersucht. Diese diskrete Verteilung berechnet die Wahrscheinlichkeit, innerhalb einer bestimmten Anzahl von Versuchen eine bestimmte Anzahl von Erfolgen zu erzielen. Die binomiale Wahrscheinlichkeitsverteilung findet in verschiedenen Branchen Anwendung, darunter Rohstoffhandel, Versicherungen und Lieferkettenbetriebe. Daher ist es für Datenwissenschaftler ein wertvolles Konzept, sich dessen bewusst zu sein.

Der vollständige Code ist hier auf meinem GitHub verfügbar:

(Alle Emojis entworfen von OpenMoji – das Open-Supply-Emoji- und Icon-Projekt. Lizenz: CC BY-SA 4.0)



Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here