決定係数とは何ですか?
測定係数は、相関係数の平方の数学的計算です。相関係数は、モデルの精度の計算です。 これらの用語は、かなり論理的な計算を説明するために統計分析で使用されます。
統計では、アナリストの仕事は、特定のシナリオまたはイベントから収集されたデータを調べて、データを説明する数学モデルを作成することです。このモデルを作成するには、考慮する必要がある特定の事実があります。
データのすべての計算と収集にエラーが発生する可能性があります。これは一貫しているため、エラーの速度をモデルに組み込む必要があります。このエラーを説明することにより、提案されたモデルがデータのしっかりした説明を提供するかどうかを判断することに関連しなくなります。
実際の決定係数計算は
です
r 2 = 2乗エラーの合計
2乗エラーの合計s + sub of squares
決定係数は、統計分析で使用されるデータの説明におけるモデルの精度の計算です。この値は、データに対する統計モデルの「適合度」への洞察を提供します。係数の値は0〜1の間です。変動を説明するモデルの完全な適合は1、0はモデルがバリエーションをまったく説明しない場合の値です。
決定係数は、データ、または外れ値、および二乗の回帰合計を使用したエラーを考慮します。この値には本質的に比率であり、サンプルのサイズとはまったく関係がないため、ユニットはありません。値が高いほど、1に近づくと、モデルによってバリエーションのより良い説明が提供されています。
この概念を視覚化する簡単な方法は、粒子を取り巻くすべてのデータのグラフを作成することですARイベント。ランチルーム、チョコレート、アーモンド、ピーナッツに3つのクッキーのトレイを設定します。人々が昼食室に来て、彼らがどれだけのクッキーを服用し、どのような種類、どの順序で撮影するかを書き留めてください。このデータをグラフでプロットします。
予測される動作の周りに式を作成します。例としては、1つのチョコレートクッキーを服用したすべての人が2つのアーモンドを服用したが、ピーナッツは服用していないことを予測することです。 単純な線形方程式は、この仮定に基づいて書くことができ、グラフ化できます。
その予測の線形方程式を表す線をプロットします。あなたの観察中の実際のデータ収集と線を比較してください。実際のデータと比較した場合、予測された動作の精度の尺度を提供するために、決定係数を計算します。
決定係数は、ライン周辺のデータの広がり量を示します。実際の値と比較して、予測がどれほど良いか悪いかを示しています。決定係数は、ユーザーtを許可しますo統計モデルで提案されているデータに「現実チェック」を適用します。観測された値または実際の値、およびモデルまたは予測された値の2つの値があります。
このタイプの統計分析は非常に一般的です。多くのビジネス上の決定は、将来の行動の予測に基づいています。実際の結果を分析し、それらを予測と比較することが重要です。このプロセスは、次のモデルを改善するため、予測の精度を改善します。