決定係数とは何ですか?
決定係数は、相関係数の二乗の数学的計算です。 相関係数は、モデルの精度の計算です。 これらの用語は、かなり論理的な計算を説明するために統計分析で使用されます。
統計では、アナリストの仕事は、特定のシナリオまたはイベントから収集されたデータを調べ、データを説明する数学モデルを作成することです。 このモデルを作成するには、考慮する必要がある特定の事実があります。
すべての計算およびデータ収集でエラーが発生する可能性があります。 これには一貫性があるため、エラー率をモデルに組み込む必要があります。 このエラーを考慮することにより、提案されたモデルがデータの確固たる説明を提供するかどうかを判断することに関連性がなくなります。
決定計算の実際の係数は
R 2 =二乗誤差の合計
平方誤差の合計+回帰平方和
決定係数は、データの説明におけるモデルの精度の計算です。
統計分析で使用されるこの値は、データに対する統計モデルの「適合度」に関する洞察を提供します。 係数の値は0〜1です。変動を説明するモデルの完全な適合は1で、モデルが変動をまったく説明しない場合の値です。
決定係数では、データの誤差、または外れ値、および回帰平方和が考慮されます。 これは基本的に比率であり、サンプルのサイズとはまったく関係がないため、この値に単位はありません。 値が1に近づくほど、モデルによって変動のより良い説明が提供されます。
この概念を視覚化する簡単な方法は、特定のイベントを取り巻くすべてのデータのグラフを作成することです。 ランチルームで3枚のクッキートレイ、チョコレート、アーモンド、ピーナッツを用意します。 人々がランチルームに来て、クッキーの数、種類、順序を書き留めてください。 このデータをグラフにプロットします。
予測された動作に関する式を作成します。 一例として、チョコレートクッキーを1個取り、アーモンドも2個取りましたが、ピーナッツは取りませんでした。 この仮定に基づいて単純な線形方程式を記述し、グラフ化できます。
その予測の線形方程式を表す線をプロットします。 行を観測の実際のデータコレクションと比較します。 決定係数を計算して、実際のデータと比較したときの予測された動作の精度の尺度を提供します。
決定係数は、線の周りのデータの広がりの量を示します。 実際の値と比較して、予測がどの程度良かったのかを示します。 決定係数により、ユーザーは統計モデルで提案されたデータに「リアリティチェック」を適用できます。 観測値または実際の値と、モデル化された値または予測された値の2つの値があります。
このタイプの統計分析は、科学およびビジネスにおいて非常に一般的です。 多くのビジネス上の決定は、将来の行動の予測に基づいています。 実際の結果を分析し、それらを予測と比較することが重要です。 このプロセスにより、次のモデルが改善されるため、予測の精度が向上します。