결정 계수는 무엇입니까?
결정 계수는 상관 계수의 제곱의 수학적 계산입니다. 상관 계수는 모델의 정확도 계산입니다. 이 용어는 통계 분석에서 상당히 논리적 계산을 설명하는 데 사용됩니다.
통계에서 분석가의 임무는 특정 시나리오 또는 이벤트에서 수집 된 데이터를보고 데이터를 설명하는 수학적 모델을 만드는 것입니다. 이 모델을 만들려면 고려해야 할 몇 가지 사실이 있습니다.
모든 계산 및 데이터 수집에 오류가있을 수 있습니다. 이것이 일관되므로 오류율을 모델에 통합해야합니다. 이 오류를 설명함으로써 제안 된 모델이 데이터에 대한 확실한 설명을 제공하는지 여부를 결정하는 것과 관련이 없습니다.
실제 결정 계수 계산은
R 2 = 제곱 오차의 합
제곱 오차의 합 + 회귀 제곱합
결정 계수는 데이터를 설명 할 때 모델의 정확도를 계산 한 것입니다.
통계 분석에 사용되는이 값은 통계 모델의 "적합성"에 대한 통찰력을 데이터에 제공합니다. 계수의 값은 0과 1 사이입니다. 변동을 설명하기위한 모형의 완벽한 적합은 1이고 0은 모형이 변동을 전혀 설명하지 않을 때의 값입니다.
결정 계수는 데이터 또는 특이 치 및 회귀 제곱합의 오류를 고려합니다. 이 값의 단위는 본질적으로 비율이며 샘플 크기와 완전히 관련이 없으므로이 값에 대한 단위는 없습니다. 값이 높을수록 1에 가까울수록 변동에 대한 더 나은 설명이 모델에 의해 제공됩니다.
이 개념을 시각화하는 간단한 방법은 특정 이벤트를 둘러싼 모든 데이터의 그래프를 만드는 것입니다. 식당, 초콜릿, 아몬드 및 땅콩에 쿠키 트레이 3 개를 설치하십시오. 사람들이 식당에 들어올 때 관찰 한 쿠키 수, 종류 및 순서를 적습니다. 이 데이터를 그래프에 표시하십시오.
예측 된 동작을 중심으로 수식을 만듭니다. 예를 들어 초콜릿 쿠키 1 개를 섭취 한 사람은 아몬드 2 개를 섭취했지만 땅콩은 섭취하지 않은 것으로 예측할 수 있습니다. 이 가정을 기반으로 간단한 선형 방정식을 작성하고 그래프로 표시 할 수 있습니다.
해당 예측의 선형 방정식을 나타내는 선을 플로팅합니다. 선을 관측치의 실제 데이터 수집과 비교하십시오. 실제 데이터와 비교할 때 예측 된 동작의 정확도를 측정하기 위해 결정 계수를 계산하십시오.
결정 계수는 선 주위의 데이터 확산 량을 나타냅니다. 실제 값과 비교하여 예측이 얼마나 좋았는지 나쁜지를 보여줍니다. 결정 계수는 사용자가 통계 모델에서 제안 된 데이터에 "실제 점검"을 적용 할 수 있도록합니다. 관측 값 또는 실제 값과 모델링되거나 예측 된 값의 두 가지 값이 있습니다.
이러한 유형의 통계 분석은 과학 및 비즈니스에서 매우 일반적입니다. 많은 비즈니스 결정은 미래 행동의 예측을 기반으로합니다. 실제 결과를 분석하고 예측 결과와 비교하는 것이 중요합니다. 이 프로세스는 다음 모델과 예측 정확도를 향상시킵니다.