中央極限定理とは何ですか?
統計の中心極限定理は、多数のランダム変数の合計または平均が正規分布に近似することを示しています。 二項分布にも適用できます。 サンプルサイズが大きいほど、分布は正規分布に近くなります。
中心極限定理が近づく正規分布は、対称的なベル曲線のような形をしています。 正規分布は、ギリシャ文字muで表される平均と、sigmaで表される標準偏差によって記述されます。 平均は単に平均であり、ベル曲線がピークになるポイントです。 標準偏差は、分布内の変数の広がり具合を示します。標準偏差が低いと、曲線が狭くなります。
ランダム変数の分布方法は、中心極限定理では重要ではありません。サンプルサイズが十分に大きい場合、変数の合計または平均は依然として正規分布に近づきます。 ランダムサンプルは母集団から抽出されて合計または平均を取得するため、ランダム変数のサンプルサイズは重要です。 描画されるサンプルの数とそれらのサンプルのサイズの両方が重要です。
ランダム変数から引き出されたサンプルから合計を計算するには、まずサンプルサイズが選択されます。 サンプルのサイズは2つまで小さくても、非常に大きくてもかまいません。 ランダムに描画され、サンプルの変数が加算されます。 この手順は何度も繰り返され、結果は統計分布曲線にグラフ化されます。 サンプル数とサンプルサイズが十分に大きい場合、曲線は正規分布に非常に近くなります。
サンプルは、平均と同じ方法で中心極限定理で平均値として描画されますが、加算する代わりに各サンプルの平均が計算されます。 サンプルサイズが大きいほど、結果は正規分布により近くなり、通常は標準偏差も小さくなります。 合計に関しては、サンプルの数が多いほど、正規分布へのより良い近似が得られます。
中心極限定理は二項分布にも適用されます。 二項分布は、コインの反転など、結果が2つしかないイベントに使用されます。 これらの分布は、各試行の実行された試行数nと成功確率pによって記述されます。 二項分布の平均と標準偏差は、nとpを使用して計算されます。 nが非常に大きい場合、二項分布と正規分布の平均と標準偏差は同じになります。