Skip to main content

Что такое гипергеометрическое распределение?

Гипергеометрическое распределение описывает вероятность определенных событий, когда последовательность элементов выбирается из фиксированного набора, например, при выборе игральных карт из колоды. Ключевой характеристикой событий, следующих за гипергеометрическим распределением вероятностей, является то, что элементы не заменяются между розыгрышами. После того, как определенный объект был выбран, он не может быть выбран снова. Эта функция наиболее важна при работе с небольшим населением.

Аудиторы оценки качества используют гипергеометрическое распределение при анализе количества бракованной продукции в данной группе. Продукты откладываются после тестирования, потому что нет оснований тестировать один и тот же продукт дважды. Таким образом, выбор сделан без замены.

Вероятности покера рассчитываются с использованием гипергеометрического распределения, поскольку карты не перетасовываются обратно в колоду в данной руке. Первоначально, например, одна четверть карт в стандартной колоде - это пики, но вероятность получения двух карт и определения того, что они обе являются пиками, не равна 1/4 * 1/4 = 1/16. После получения первой лопаты в колоде осталось меньше пик, поэтому вероятность получения другой лопаты составляет всего 12/51. Следовательно, вероятность получить две карты и найти их обе как пики составляет 1/4 * 12/51 = 1/17.

Объекты не заменяются между розыгрышами, поэтому вероятность экстремальных сценариев уменьшается для гипергеометрического распределения. Можно сравнить красные или черные карты из стандартной колоды с подбрасыванием монеты. Честная монета будет попадать на «головы» половину времени, а половина карт в стандартной колоде черные. Тем не менее, вероятность получения пяти последовательных голов при подбрасывании монеты больше, чем вероятность получить пятикарточную комбинацию и найти их всех как черные карты. Вероятность пяти последовательных голов составляет 1/2 * 1/2 * 1/2 * 1/2 * 1/2 = 1/32 или около 3 процентов, а вероятность пяти черных карт равна 26/52 * 25 / 51 * 24/50 * 23/49 * 22/48 = 253/9996 или около 2,5%.

Выборка без замены снижает вероятность экстремальных случаев, но не влияет на среднее арифметическое распределения. Среднее число голов, ожидаемое при подбрасывании монеты пять раз, составляет 2,5, и это равняется среднему количеству черных карт, ожидаемых в руке из пяти карт. Как маловероятно, что все пять карт чёрные, так и маловероятно, что ни одна из них не будет. Это описывается на математическом языке, говоря, что замена снижает дисперсию, не влияя на ожидаемое значение распределения.