分散とは
範囲と同様に、分散は、特定のサンプルまたは母集団の広がりに関連する統計です。 各要素と平均値との差の二乗を合計し、その合計を母集団内の要素数で割ることにより、特定の母集団について計算されます。 母集団が平均の周りに密集しているほど、分散は低くなります。
密接に関連する統計は標準偏差であり、これは分散の平方根です。 標準偏差は、より直感的で平均と同じ単位を共有するため、記述統計でより頻繁に使用されます。 多くの現象に共通する古典的な釣鐘型の分布曲線である正規分布では、人口の95%をわずかに上回る平均の2つの標準偏差内にあります。
分散は、回帰や分散分析(ANOVA)などの予測統計手法に最も役立ちます。 回帰では、変数と分散に影響する1つ以上の要因の合計として変数をモデル化します。これは、実際に観測される要素とその期待値との差を表します。 たとえば、都市での建設雇用は、基本レベル、季節の季節調整、国民経済の調整、および分散としてモデル化される場合があります。 回帰技法は、分散が最小のモデルを決定しようとするため、予測の期待値は、観測が可能になった後に観測値に近くなることが期待されます。
臨床試験で一般的に使用されるANOVAは、分散の原因を分類する統計的手法です。 観察結果は、実験の対象となる1つまたは複数の要因によって分類されます。 最小二乗法を使用して、1つまたは複数の要因が変数に与える影響を判断する目的で、分散をランダムエラー、要因効果、および相互作用効果に分割します。 たとえば、新しい肥料をテストしている企業は、研究対象の変数として作物収量、肥料が使用された要因、および作物が受け取った降水量を用いたANOVA実験を使用する場合があります。 新しい肥料が他の肥料とどのように比較されるかは、実験における因子効果です。 もし新しい肥料が標準的な降雨ではライバルよりも優れていたが、大雨ではそうならなかったら、それは相互作用効果の例でしょう。