단순 선형 회귀는 무엇입니까?
단순 선형 회귀 분석은 통계에 적용되며 선형 관계가있는 것으로 보이는 (x, y) 데이터를 설명하는 데 도움이되므로 x가 알려진 경우 y를 약간 예측할 수 있습니다. 이 데이터는 종종 산점도에 표시되며 선형 회귀 공식은 실제로 선형 상관 관계가있는 경우 모든 점에 가장 적합한 선을 만듭니다. 모든 점에 정확히 맞지는 않지만 실제 데이터와 예상 데이터 (잔여) 간의 차이의 제곱의 합이 가장 낮은 수를 만드는 선이어야합니다. 최고로 잘 맞는. 표본 데이터 및 모집단 데이터의 선 방정식은 다음과 같습니다. ŷ = b 0 + b 1 x 및 Y = B 0 + B 1 x.
대수에 익숙한 사람은이 선의 y = mx + b와의 유사성을 주목할 수 있으며 실제로 방정식의 오른쪽에있는 두 용어가 바뀌어 B 1 이 기울기 또는 m과 동일하다는 것을 제외하고는 두 개가 상대적으로 동일합니다. 이 재배 열의 이유는 다른 비선형 형태의 관계를 설명 할 수있는 지수와 같은 특징을 가진 용어를 추가하여 우아하게 쉽게 추가 할 수 있기 때문입니다.
간단한 선형 회귀선을 얻는 공식은 상대적으로 복잡하고 번거롭고 대부분의 사람들은 완료하는 데 오랜 시간이 걸리기 때문에 이것을 쓰는 데 많은 시간을 소비하지 않습니다. 대신 Excel® 또는 여러 유형의 공학용 계산기와 같은 다양한 프로그램에서 최소 제곱 선을 쉽게 계산할 수 있습니다. (x, y) 데이터 세트 사이에 강한 상관 관계가 있음이 분명한 경우에만이 선이 예측에 적합합니다. 계산기는 사용하기에 적합한 지 여부에 관계없이 선을 생성합니다.
동시에 간단한 선형 회귀선 방정식이 생성되므로 사람들은 상관 수준을 살펴 봐야합니다. 이는 선형 상관이 존재하는지 판별하기 위해 값 테이블에 대해 상관 계수 r을 평가 함을 의미합니다. 또한 데이터를 산점도로 플로팅하여 데이터를 평가하는 것은 데이터가 선형 관계를 갖는지 이해하는 좋은 방법입니다.
선형 상관 관계가있는 경우 간단한 선형 회귀선으로 수행 할 수있는 것은 값을 x로 대체하여 ŷ에 대한 예측 값을 얻을 수 있다는 것입니다. 이 예측에는 한계가 있습니다. 존재하는 데이터, 특히 샘플 인 경우 현재 선형 상관 관계가있을 수 있지만 나중에 추가 샘플 재료가 추가되지 않을 수도 있습니다.
대안 적으로, 전체 표본은 상관이없는 반면 전체 표본은 상관 관계를 공유 할 수 있습니다. 따라서 예측은 제한되어 있으며 사용 가능한 데이터 값을 훨씬 뛰어 넘는 것을 외삽 법이라고하며 권장하지 않습니다. 또한, 사람들은 선형 상관 관계가 존재하지 않으면 x의 가장 좋은 추정치는 모든 y 데이터의 평균이라는 것을 알고 있습니다.
본질적으로 간단한 선형 회귀는 재량으로 ax 값을 기준으로 ŷ 값을 예측하는 데 사용할 수있는 유용한 통계 도구입니다. 회귀선의 유용성을 결정하려면 r의 분석이 필요하기 때문에 거의 항상 선형 상관 관계에 대한 개념을 배웁니다. 다행스럽게도 많은 현대 기술 프로그램에서 사람들은 산점도를 그래프로 작성하고 회귀선을 추가하며 몇 가지 항목으로 상관 계수 r을 결정할 수 있습니다.