二項分布とは何ですか?
パラメーター(n、p)を持つ二項分布は、各試行が独立しており、試行の結果が成功または失敗のいずれかであると仮定して、成功の確率pで、n回の試行からx回成功する離散確率を与えます。 n回の試行の成功の平均数は平均npであり、分散はnp(1-p)です。 二項分布は、負の二項分布とベルヌイ分布を含むイベント関連分布のファミリーに属します。 二項分布の確率は、試行回数が増えると非常に大きくなる階乗関数を使用して計算されるため、通常、正規分布またはポアソン分布の二項分布近似が使用されます。
たとえば、公正なコインは2回裏返され、成功は頭を得ると定義されます。 試行回数はn = 2で、頭を投げる確率はp =½です。 結果は二項分布表にまとめることができます:頭がない確率、P(x = 0)は25%、1つの頭の確率、P(x = 1)は50%、2つの頭の確率P(x = 2)は25%です。 トスされる予想ヘッド数はnp = 2 * 1/2 = 1です。分散はnp(1-p)=½です。
他の分布はイベントの確率を表し、二項分布と同じファミリーに属します。 Bernouilli分布は、単一イベントの成功確率を与え、n = 1の二項分布に相当します。負の二項分布は、x個の失敗の確率を与えます。通常の二項分布は、x個の成功の確率を与えます。
多くの場合、2項分布の累積密度関数が使用されます。これにより、n回の試行でx回以下の成功の確率が得られます。 この確率の計算は、小さなnの場合は簡単ですが、二項係数のために、nが大きくなると退屈になります。 二項係数は「n choose x」と読み、n個の可能性からx個の結果を選択できる組み合わせの数を指します。 階乗関数を使用して計算されます。 試行回数(n)が70を超えると、n階乗が膨大になり、標準の計算機では計算できなくなります。
nが大きくなるときの二項分布の近似は、離散的または連続的です。 nが非常に大きく、pが非常に小さい場合、二項分布は離散ポアソン分布になります。 nがpに対する制約なしで十分に大きい場合、二項正規分布近似を使用できます。 二項平均と標準偏差が正規分布のパラメーターになり、累積密度関数の計算時に連続性の補正が適用されます。