Hvad er hypergeometrisk distribution?
Hypergeometrisk fordeling beskriver sandsynligheden for visse begivenheder, når en sekvens af elementer trækkes fra et fast sæt, såsom valg af spillekort fra et dæk. Det centrale kendetegn ved begivenheder efter den hypergeometriske sandsynlighedsfordeling er, at genstandene ikke erstattes mellem lodtrækninger. Når der er valgt et bestemt objekt, kan det ikke vælges igen. Denne funktion er mest vigtig, når du arbejder med små populationer.
Kvalitetsvurderingsrevisorer bruger den hypergeometriske fordeling når de analyserer antallet af defekte produkter i en given gruppe. Produkter afsættes efter testning, fordi der ikke er nogen grund til at teste det samme produkt to gange. Således foretages valget uden udskiftning.
Pokersandsynligheder beregnes ved hjælp af den hypergeometriske fordeling, fordi kort ikke blandes tilbage i bunken inden for en given hånd. Oprindeligt er fx en fjerdedel af kortene i et standarddæk spar, men sandsynligheden for at få to kort tildelt og finde dem begge som spar er ikke 1/4 * 1/4 = 1/16. Efter at have modtaget den første spade, er der færre spar tilbage i dækket, så sandsynligheden for at få en anden spade er kun 12/51. Derfor er sandsynligheden for at få to kort tildelt og finde dem begge til at være spar, 1/4 * 12/51 = 1/17.
Objekter erstattes ikke mellem lodtrækninger, så sandsynligheden for ekstreme scenarier reduceres for en hypergeometrisk fordeling. Man kan sammenligne at få røde eller sorte kort fra et standarddæk til at vende en mønt. En fair mønt vil lande på ”hoveder” halvdelen af tiden, og halvdelen af kortene i et standarddæk er sort. Alligevel er sandsynligheden for at få fem på hinanden følgende hoveder, når du vipper en mønt, større end sandsynligheden for at få en femkorts hånd og finde dem alle som sorte kort. Sandsynligheden for fem på hinanden følgende hoveder er 1/2 * 1/2 * 1/2 * 1/2 * 1/2 = 1/32, eller cirka 3 procent, og sandsynligheden for fem sorte kort er 26/52 * 25 / 51 * 24/50 * 23/49 * 22/48 = 253/9996 eller ca. 2,5 procent.
Prøveudtagning uden udskiftning reducerer sandsynligheden for ekstreme tilfælde, men det påvirker ikke det aritmetiske gennemsnit af fordelingen. Det gennemsnitlige antal hoveder, der forventes, når man vender en mønt fem gange, er 2,5, og det svarer til det gennemsnitlige antal sorte kort, der forventes i en femkortshånd. Ligesom det er meget usandsynligt, at alle fem kort er sorte, er det også usandsynligt, at ingen af dem er det. Dette beskrives på matematisk sprog ved at sige, at udskiftning sænker variationen uden at påvirke den forventede værdi af en distribution.