Hva er hypergeometrisk distribusjon?
Hypergeometrisk fordeling beskriver sannsynligheten for visse hendelser når en sekvens av elementer trekkes fra et fast sett, for eksempel å velge spillkort fra en kortstokk. Det sentrale kjennetegn ved hendelser etter den hypergeometriske sannsynlighetsfordelingen er at gjenstandene ikke erstattes mellom trekninger. Etter at et bestemt objekt er valgt, kan det ikke velges igjen. Denne funksjonen er mest viktig når du arbeider med små populasjoner.
Kvalitetsvurderingsrevisorer bruker den hypergeometriske fordelingen når de analyserer antall mangelfulle produkter i en gitt gruppe. Produktene blir avsatt etter å ha blitt testet fordi det ikke er noen grunn til å teste det samme produktet to ganger. Dermed blir utvalget gjort uten erstatning.
Pokersannsynligheter blir beregnet ved hjelp av den hypergeometriske fordelingen fordi kort ikke blir blandet tilbake i kortstokken i en gitt hånd. Til å begynne med er for eksempel en fjerdedel av kortene i en standard kortstokk spader, men sannsynligheten for å få utdelt to kort og finne dem begge som spar er ikke 1/4 * 1/4 = 1/16. Etter å ha mottatt den første spaden, er det færre spar igjen i dekket, så sannsynligheten for å få utdelt en annen spade er bare 12/51. Derfor er sannsynligheten for å få utdelt to kort og finne dem begge til å være spar 1/4 * 12/51 = 1/17.
Objekter erstattes ikke mellom tegninger, så sannsynligheten for ekstreme scenarier reduseres for en hypergeometrisk fordeling. Man kan sammenligne det å få utdelt røde eller svarte kort fra et standard kortstokk til å slå en mynt. En rettferdig mynt vil lande på ”hoder” halve tiden, og halvparten av kortene i en standard kortstokk er svarte. Likevel er sannsynligheten for å få fem hoder på rad når du vipper en mynt, større enn sannsynligheten for å få utdelt en femkortshånd og finne at de alle er svarte kort. Sannsynligheten for fem hoder på rad er 1/2 * 1/2 * 1/2 * 1/2 * 1/2 = 1/32, eller omtrent 3 prosent, og sannsynligheten for fem svarte kort er 26/52 * 25 / 51 * 24/50 * 23/49 * 22/48 = 253/9996, eller omtrent 2,5 prosent.
Prøvetaking uten erstatning reduserer sannsynligheten for ekstreme tilfeller, men det påvirker ikke det aritmetiske gjennomsnittet av fordelingen. Gjennomsnittlig antall hoder forventet når man vipper en mynt fem ganger er 2,5, og dette tilsvarer det gjennomsnittlige antallet svarte kort som forventes i en femkortshånd. Akkurat som det er veldig usannsynlig at alle fem kortene er svarte, er det heller ikke usannsynlig at ingen av dem er det. Dette er beskrevet i matematisk språk ved å si at erstatning senker variansen uten å påvirke den forventede verdien av en distribusjon.