Co to jest rozkład hipergeometryczny?
Rozkład hipergeometryczny opisuje prawdopodobieństwo pewnych zdarzeń, gdy ciąg przedmiotów jest losowany z ustalonego zestawu, np. Wybór kart do gry z talii. Kluczową cechą zdarzeń po hipergeometrycznym rozkładzie prawdopodobieństwa jest to, że elementy nie są zastępowane między losowaniami. Po wybraniu określonego obiektu nie można go wybrać ponownie. Ta funkcja jest najbardziej istotna podczas pracy z małymi populacjami.
Audytorzy oceny jakości stosują rozkład hipergeometryczny podczas analizy liczby wadliwych produktów w danej grupie. Produkty są odkładane na bok po przetestowaniu, ponieważ nie ma powodu, aby dwukrotnie testować ten sam produkt. Zatem wybór odbywa się bez wymiany.
Prawdopodobieństwa pokera są obliczane przy użyciu rozkładu hipergeometrycznego, ponieważ karty nie są tasowane z powrotem do talii w ramach danego układu. Początkowo, na przykład, jedna czwarta kart w standardowej talii to pik, ale prawdopodobieństwo otrzymania dwóch kart i znalezienia obu z nich nie wynosi 1/4 * 1/4 = 1/16. Po otrzymaniu pierwszego pika w talii pozostało mniej pik, więc prawdopodobieństwo otrzymania kolejnego pika wynosi tylko 12/51. Dlatego prawdopodobieństwo otrzymania dwóch kart i znalezienia ich jako pik to 1/4 * 12/51 = 1/17.
Obiekty nie są zastępowane między losowaniami, więc prawdopodobieństwo ekstremalnych scenariuszy jest zmniejszone dla rozkładu hipergeometrycznego. Można porównać rozdawanie czerwonych lub czarnych kart ze standardowej talii do rzucania monetą. Sprawiedliwa moneta wyląduje na „głowach” w połowie czasu, a połowa kart w standardowej talii jest czarna. Jednak prawdopodobieństwo zdobycia pięciu kolejnych głów przy rzucie monetą jest większe niż prawdopodobieństwo otrzymania rozdania z pięcioma kartami i znalezienia ich wszystkich jako czarnych kart. Prawdopodobieństwo pięciu kolejnych głów wynosi 1/2 * 1/2 * 1/2 * 1/2 * 1/2 = 1/32, czyli około 3 procent, a prawdopodobieństwo pięciu czarnych kart wynosi 26/52 * 25 / 51 * 24/50 * 23/49 * 22/48 = 253/9996, czyli około 2,5 procent.
Pobieranie próbek bez zamiany zmniejsza prawdopodobieństwo ekstremalnych przypadków, ale nie wpływa na średnią arytmetyczną rozkładu. Średnia spodziewana liczba głów po pięciokrotnym rzucie monetą wynosi 2,5, co równa się średniej liczbie czarnych kart oczekiwanej w pięciokartowym rozdaniu. Podobnie jak mało prawdopodobne jest, aby wszystkie pięć kart było czarnych, jest również mało prawdopodobne, aby żadna z nich nie była. Jest to opisane w języku matematycznym, mówiąc, że zamiana obniża wariancję bez wpływu na oczekiwaną wartość rozkładu.