分散分析とは
研究を行う場合、2つ以上のサンプルまたはグループを比較するデータを分析することが必要になる場合があります。 推論統計テストの一種である分散分析(ANOVA)では、サンプル間に重要な関係が存在するかどうかを判断する目的で、複数のサンプルを同時に検査できます。 推論はt検定と同じです。分散分析には、2つ以上のサンプルの独立変数が含まれます。 サンプル間の差異と1つのサンプル内の差異が決定されます。 ANOVAは、測定レベル、サンプリング方法、母集団の分布、分散の均一性の4つの仮定に基づいています。
差異が重要であるかどうかを判断するために、ANOVAはサンプル間およびサンプル内の差異を考慮します。これは分散と呼ばれます。 ANOVAは、サンプルメンバー間の分散と比較して、サンプル間の分散が大きいかどうかを調べることができます。 これが真であることが判明した場合、違いは重要であると見なされます。
ANOVAテストの実施には、特定の仮定の受け入れが含まれます。 1つ目は、独立したランダムサンプリング方法が使用され、単一の母集団からのサンプルメンバーの選択が、後の母集団からのメンバーの選択に影響を与えないことです。 従属変数は、主に間隔比レベルで測定されます。 ただし、分散分析を順序レベルの測定に適用することは可能です。 これは検証可能ではありませんが、母集団は正規分布しており、母集団の分散は同じであると仮定できます。つまり、母集団は同質であることを意味します。
この研究仮説では、少なくとも1つの平均が他の平均と異なることを前提としていますが、異なる平均はより大きくも小さくも識別されません。 違いが存在するという事実のみが予測されます。 ANOVAは帰無仮説をテストします。つまり、A = B = Cのように、すべての平均値に差がないことを意味します。これには、帰無仮説が棄却される確率レベルを参照してアルファを設定する必要があります。
F比は、Fスコアが帰無仮説の棄却面積の開始位置を示すため、分散分析に特に使用される検定統計量です。 統計学者のロナルドフィッシャーによって開発されたFの式は次のとおりです。F=グループ間分散推定値(MSB)をグループ内分散推定値(MSW)で割ったもの。 各分散推定値は、2乗和(SSBとSSW)と自由度(df)の2つの部分で構成されています。 生物学、農業、および医学研究の統計表を使用して、アルファを設定し、これに基づいて、差がないという帰無仮説を拒否できます。 その場合、すべてのグループ間に有意差が存在すると結論付けることができます。