Was ist die geometrische Verteilung?
Die geometrische Verteilung ist eine diskrete Wahrscheinlichkeitsverteilung, die die Anzahl der Bernoulli-Versuche zählt, bis ein Erfolg erzielt wird. Ein Bernoulli-Versuch ist ein unabhängiges wiederholbares Ereignis mit einer festen Erfolgswahrscheinlichkeit p und einer Wahrscheinlichkeit q = 1-p des Scheiterns, beispielsweise das Werfen einer Münze. Beispiele für Variablen mit geometrischer Verteilung sind das Zählen, wie oft ein Würfelpaar gewürfelt werden muss, bis 7 oder 11 gewürfelt werden, oder das Untersuchen von Produkten auf einer Montagelinie, bis ein Fehler gefunden wird.
Dies wird als geometrische Verteilung bezeichnet, da die aufeinanderfolgenden Terme eine geometrische Reihe bilden. Die Erfolgswahrscheinlichkeit für den ersten Versuch ist p , die Wahrscheinlichkeit für den zweiten Versuch ist pq , die Wahrscheinlichkeit für den dritten Versuch ist pq 2 und so weiter. Die verallgemeinerte Wahrscheinlichkeit für den n-ten Term ist pq n-1, was die Wahrscheinlichkeit von n-1 Ausfällen in einer Reihe multipliziert mit der Erfolgswahrscheinlichkeit im abschließenden Versuch ist. Die geometrische Verteilung ist ein spezifisches Beispiel für eine negative Binomialverteilung, die die Anzahl der Bernoulli-Versuche zählt, bis r Erfolge erzielt werden. Einige Texte bezeichnen es auch als Pascal-Verteilung, während andere den Begriff allgemeiner für negative Binomialverteilungen verwenden.
Die geometrische Verteilung ist die einzige diskrete Wahrscheinlichkeitsverteilung mit der No-Memory-Eigenschaft, die angibt, dass die Wahrscheinlichkeit nicht von dem beeinflusst wird, was zuvor aufgetreten ist. Dies ist eine Folge der Unabhängigkeit der Bernoulli-Prozesse. Wenn die Variable zum Beispiel die Häufigkeit ist, mit der ein Rouletterad gedreht werden muss, um schwarz zu werden, hat die Häufigkeit, mit der das Rad vor Beginn der Zählung rot angezeigt wird, keinen Einfluss auf die Verteilung.
Der Durchschnitt einer geometrischen Verteilung beträgt 1 / p . Wenn also die Wahrscheinlichkeit, dass ein Produkt am Fließband fehlerhaft ist, 0,0025 beträgt, ist zu erwarten, dass durchschnittlich 400 Produkte untersucht werden, bevor ein Fehler festgestellt wird. Die Varianz einer geometrischen Verteilung beträgt q / p2 .