頻度分布曲線とは何ですか?
頻度分布曲線は、特定の変数の発生頻度を示すグラフとして表される記述統計の一種です。xは変数の発生の測定値を表し、 yは各頻度のケース数を表します。 非常に大きな母集団では、頻度分布曲線はベル曲線の統計的理想に似ていると言われ、正規分布の特性を仮定します。 ベルカーブ( 通常カーブとも呼ばれます)は、適切な名前が付けられています。 それは、x軸のゼロ周波数に向かって先細りになっている対称的な端部を持つ丸いベルに似ています。 ベル曲線は、すべての測定データの理想化された同一の平均(μ)、中央値、およびモードによって二分され、各グラフの半分は両側にあります。
サンプルの頻度分布曲線が理想的なベル曲線の特性を持っていると想定される場合、調査対象の母集団の側面も同様に想定できます。 さらに、標準的な統計式は、そのような仮定が信頼できる程度を与えることができます。 理想的な釣鐘曲線では、母集団の平均、中央値、最頻値はすべて等しいと見なされます。 次に、標準偏差σの計算により、母集団データの「広がり」の尺度が得られます。 理想的な曲線では、母集団の合計データの0.25%を除くすべてが、度数分布曲線の平均から±3標準偏差内、またはμ-3σとμ+3σの間にあります。
理想的なベル曲線は、サンプル頻度分布曲線とはいくつかの点で異なりますが、サンプル母集団とサンプル母集団全体の単一の測定位置の両方をある程度理解することができます。 理想的な曲線では、サンプルで、おそらく母集団で測定された変数の値の68%が、いずれかの方向の平均、またはμ-1σとμ+1σから1標準偏差以内になります。 ベル曲線に沿ってさらに移動すると、サンプルと母集団の95%の値は、平均からプラスまたはマイナス2標準偏差内、またはμ-2σとμ+2σ内に位置します。 頻度分布曲線の端で、0.25パーセントを除くすべてがプラスまたはマイナス3標準偏差内に収まります。 3つの標準偏差の測定値を超えて0.25%にあるまれな測定値は、外れ値と呼ばれ、推論計算が行われるときにデータから削除されることがよくあります。