自由度とは何ですか?
自由度(df)は、統計および物理学で最もよく使用される概念です。 どちらの場合でも、視覚的に表現できるように、システムの制限と分析対象の位置またはサイズを定義する傾向があります。 両方のフィールドでのdfの定義は関連していますが、まったく同じではありません。
物理学では、自由度はオブジェクトまたはシステムを配置し、各自由度は時間、空間、または他の測定の位置を参照します。 Dfは座標という用語と同義語として使用できますが、通常は最小数の独立した座標を意味します。 実際の自由度は、位相空間で記述されているシステム、またはシステムが同時に居住するすべての潜在的なタイプの空間に基づいています。 システムが占有する位相空間のすべての部分はdfとみなすことができ、これは考慮されるシステムの完全な現実を定義するのに役立ちます。
統計的観点から、自由度は母集団またはサンプルの分布を定義し、人々が推論統計、すなわち仮説検定と信頼区間を研究し始めるときに遭遇します。 科学的定義と同様に、統計のdfは、データに応じてサンプルまたは母集団の形状または側面を表します。 描かれた分布のすべての表現に自由度の測定があるわけではありません。 共通の標準正規分布は度によって定義されません。 代わりに、すべてのインスタンスで同じ鐘形の曲線になります。
標準正規分布と同様の分布はスチューデントtです。 スチューデントtは、部分的に式n-1の自由度によって定義されます。nはサンプルサイズです。 これは、分布から変数を1つずつ選択することを意味し、最後の変数を除くすべてを自由に選択できます。 最後の1つを選択する以外に選択肢はなく、その時点で他の変数を選択する自由はありません。 したがって、1つの変数はフリーではありません。 それは、その文字を選択する以外に選択肢のないScrabble®ゲーム中に、バッグから最後のタイルを選択する必要があるようなものです。
Fやカイ2乗などの分布が異なると、自由度の定義も異なり、定義によっては複数のdfを使用するものもあります。 df定義は実行されるテストのタイプにリンクされており、さまざまなパラメトリック(パラメーターに基づく)テストとノンパラメトリック(パラメーターに基づいていない)テストとは異なるため、問題は混乱を招きます。 基本的に、常にn-1であるとは限りません。 適合度または分割表の検定では、分散または標準偏差の単一変数仮説検定を評価する分布とは異なるdfのカイ二乗分布を使用できます。
覚えておくべき重要なことは、自由度が分布を定義するために使用されるたびに、それが変化するということです。 変わらない特定の特性がまだあるかもしれませんが、サイズと外観は異なります。 分布、特に異なるdfを持つ同じ分布の2つの表現を描くとき、dfが同じではないことを伝えるために、サイズが異なるように見せることをお勧めします。