単純な線形回帰とは何ですか?
単純な線形回帰は統計に適用され、線形関係があるように見える(x、y)データを記述するのに役立ち、xが既知の場合にyの予測を可能にします。 多くの場合、このデータは散布図にプロットされ、線形回帰の式は、それらが本当に線形相関を持っている限り、すべての点に最適な線を作成します。 すべての点に正確に適合するわけではありませんが、実際のデータと期待されるデータ(残差)の差の2乗の合計が最小数を作成する線である必要があります。ベストフィット。 サンプルデータと母集団データの線の方程式は、following = b 0 + b 1 xおよびY = B 0 + B 1 xです。
代数に精通している人なら誰でも、この線がy = mx + bに類似していることに気付くかもしれません。実際、2つは比較的同じです。ただし、式の右側の2つの項 この再配置の理由は、さまざまな非線形の関係を説明する指数などの機能を持つ追加の用語をエレガントに簡単に追加できるようになるためです。
単純な線形回帰直線を取得するための式は比較的複雑で面倒であり、ほとんどの人は完了するのに長い時間がかかるため、これらを書き留めるのに多くの時間を費やしません。 代わりに、Excel®や多くの種類の関数電卓などのさまざまなプログラムで、最小二乗線を簡単に計算できます。 この線は、(x、y)データのセット間に強い相関関係がある明確な証拠がある場合にのみ予測に適しています。 電卓は、使用する意味があるかどうかに関係なく、線を生成します。
単純な線形回帰直線方程式が生成されると同時に、人々は相関のレベルを見なければなりません。 これは、値のテーブルに対して相関係数rを評価して、線形相関が存在するかどうかを判断することを意味します。 さらに、散布図としてプロットしてデータを評価することは、データに線形関係がある場合に感覚をつかむための良い方法です。
線形相関がある場合、単純な線形回帰線でできることは、値をxに代入して、toの予測値を取得できることです。 この予測には限界があります。 存在するデータは、特にそれが単なるサンプルである場合、現在線形相関を持っているかもしれませんが、追加のサンプル材料が追加された後ではないかもしれません。
または、サンプル全体で相関関係を共有できますが、母集団全体では共有できません。 したがって、予測は制限されており、利用可能なデータ値をはるかに超えることは外挿と呼ばれ、推奨されていません。 さらに、線形相関が存在しない場合、xの最適な推定値はすべてのyデータの平均であることを知っている必要があります。
基本的に、単純な線形回帰は、慎重にax値に基づいてŷ値を予測するために使用できる便利な統計ツールです。 回帰直線の有用性を判断するにはrの分析が必要なため、ほとんどの場合、線形相関の考え方で教えられます。 幸いなことに、多くの最新の技術プログラムでは、散布図をグラフ化し、回帰直線を追加し、いくつかのエントリで相関係数rを決定できます。