超幾何分布とは
超幾何分布は、デッキからトランプを選択するなど、一連のアイテムが固定セットから引き出されるときの特定のイベントの確率を表します。 超幾何確率分布に従うイベントの重要な特徴は、アイテムがドロー間で置き換えられないことです。 特定のオブジェクトを選択した後、それを再度選択することはできません。 この機能は、少人数で作業する場合に最も重要です。
品質評価審査員は、特定のグループ内の欠陥製品の数を分析するときに超幾何分布を使用します。 同じ製品を2回テストする理由がないため、製品はテスト後に破棄されます。 したがって、選択は置換なしで行われます。
ポーカー確率は、特定のハンド内でカードがシャッフルされてデッキに戻されないため、超幾何分布を使用して計算されます。 たとえば、最初は、標準デッキの4分の1のカードがスペードですが、2枚のカードが配られ、両方がスペードであるとわかる可能性は1/4 * 1/4 = 1/16ではありません。 最初のスペードを受け取った後、デッキに残っているスペードが少なくなるため、別のスペードが配られる確率は12/51になります。 したがって、2枚のカードが配られ、両方がスペードであるとわかる確率は1/4 * 12/51 = 1/17です。
オブジェクトは描画間で置き換えられないため、超幾何分布の極端なシナリオの確率が低下します。 標準デッキから赤または黒のカードが配られたこととコインを投げることを比較できます。 公正なコインは半分の時間で「ヘッド」に着地し、標準デッキのカードの半分は黒です。 しかし、コインをフリップするときに5つの連続したヘッドを獲得する可能性は、5枚のカードのハンドが配られ、それらすべてがブラックカードであると判断する可能性よりも大きくなります。 5つの連続したヘッドの確率は1/2 * 1/2 * 1/2 * 1/2 * 1/2 = 1/32、または約3%であり、5つのブラックカードの可能性は26/52 * 25 /です。 51 * 24/50 * 23/49 * 22/48 = 253/9996、または約2.5パーセント。
置換なしのサンプリングは極端な場合の可能性を減らしますが、分布の算術平均には影響しません。 コインを5回フリップするときに予想されるヘッドの平均数は2.5であり、これは5カードのハンドで予想されるブラックカードの平均数に等しくなります。 5枚すべてのカードが黒である可能性が非常に低いのと同様に、どのカードも黒である可能性は低いです。 これは、置換により分布の期待値に影響を与えることなく分散が低下すると言うことで、数学言語で説明されています。