Hvad er en binomial distribution?
En binomial fordeling med parametre (n, p) giver den diskrete sandsynlighed for at have x succeser ud af n forsøg med sandsynligheden for succes p, forudsat at hvert forsøg er uafhængigt, og resultatet af en prøve er enten en succes eller en fiasko. Det gennemsnitlige antal succeser ud af n-forsøg er det gennemsnitlige np, og variansen er np (1-p). Binomialen hører til en familie med begivenhedsrelaterede fordelinger, herunder den negative binomial og Bernouilli-fordelingen. Da sandsynligheden for binomialfordeling beregnes ved hjælp af den faktorale funktion, der bliver meget stor, når antallet af forsøg øges, anvendes typisk binomialfordelings tilnærmelse af en normal eller en Poisson-distribution.
For eksempel vendes en fair mønt to gange, og en succes defineres som at få hoveder. Antallet af forsøg er n = 2, og sandsynligheden for at smide et hoved er p = ½. Resultaterne kan sammenfattes i en binomial fordelingstabel: sandsynligheden for at få ingen hoveder, P (x = 0) er 25%, sandsynligheden for et hoved, P (x = 1) er 50%, og sandsynligheden for to hoveder P (x = 2) er 25%. Det forventede antal kastede hoveder er np = 2 * 1/2 = 1. Variansen er np (1-p) = ½.
Andre fordelinger beskriver sandsynligheden for begivenheder og tilhører den samme familie som binomialen. En Bernouilli-fordeling giver sandsynligheden for succes med en enkelt begivenhed og svarer til en binomial med n = 1. Den negative binomiale fordeling giver sandsynligheden for at have x-fejl, hvor den almindelige binomial giver sandsynligheden for x-succeser.
Ofte bruges binomialdistributionens kumulative densitetsfunktion, hvilket giver sandsynligheden for at have x eller mindre succeser i n forsøg. Beregning af denne sandsynlighed er enkel for en lille n, men bliver trættende, da n bliver stor på grund af den binomiale koefficient. Binomialkoefficienten læses "n vælg x" og refererer til antallet af kombinationer, som x-udfald kan vælges fra n muligheder. Det beregnes ved hjælp af faktorfunktionen. Efterhånden som antallet af forsøg (n) bliver større end 70, bliver n factorial enormt og kan ikke længere beregnes på en standard lommeregner.
Binomialdistributionens tilnærmelse når n bliver stor kan være diskret eller kontinuerlig. Hvis n er meget stor, og p er meget lille, bliver binomialfordelingen til en diskret Poisson-distribution. Hvis n er tilstrækkelig stor uden begrænsning for p, kan den binomiale normale fordelingsmetode anvendes. Det binomiale middelværdi og standardafvigelse bliver normalfordelingsparametrene, og en korrektion for kontinuitet anvendes ved beregning af den kumulative densitetsfunktion.