Co to jest współczynnik determinacji?
Współczynnik determinacji jest matematycznym obliczeniem kwadratu współczynnika korelacji. Współczynnik korelacji jest obliczeniem dokładności modelu. Terminy te są używane w analizie statystycznej w celu wyjaśnienia dość logicznych obliczeń.
W statystykach zadaniem analityka jest przyjrzenie się danym zebranym z określonego scenariusza lub zdarzenia i stworzenie modelu matematycznego wyjaśniającego dane. Aby stworzyć ten model, należy wziąć pod uwagę pewne fakty.
Istnieje możliwość błędu w każdym obliczeniu i gromadzeniu danych. Ponieważ jest to spójne, wskaźnik błędu musi zostać włączony do modelu. Uwzględnienie tego błędu przestaje mieć znaczenie przy ustalaniu, czy proponowany model stanowi solidne wyjaśnienie danych.
Rzeczywisty współczynnik obliczenia wynosi
R 2 = Suma kwadratów błędów
Suma błędów do kwadratu + regresja suma kwadratów
Współczynnik determinacji jest obliczeniem dokładności modelu w wyjaśnianiu danych.
Ta wartość używana w analizie statystycznej zapewnia wgląd w „dobroć dopasowania” modelu statystycznego do danych. Wartość współczynnika wynosi od 0 do 1. Idealne dopasowanie modelu w celu wyjaśnienia wariantu wynosi 1, a 0 to wartość, gdy model w ogóle nie wyjaśnia wariantu.
Współczynnik determinacji uwzględnia błędy danych lub wartości odstające oraz sumę regresji kwadratów. Nie ma jednostki dla tej wartości, ponieważ jest to zasadniczo stosunek i jest całkowicie niezwiązany z wielkością próbki. Im wyższa wartość, zbliżająca się do 1, tym lepsze wyjaśnienie zmienności zapewnia model.
Prostym sposobem na zwizualizowanie tej koncepcji jest utworzenie wykresu wszystkich danych otaczających dane zdarzenie. Rozłóż trzy tace ciastek w jadalni: czekoladę, migdały i orzeszki ziemne. Obserwuj, jak ludzie wchodzą do sali obiadowej i zapisuj, ile ciasteczek biorą, jakie rodzaje i w jakiej kolejności. Wykreśl te dane na wykresie.
Utwórz formułę wokół przewidywanego zachowania. Przykładem może być przewidywanie, że każda osoba, która wzięła 1 czekoladowe ciasteczko, również wzięła 2 migdały, ale nie miała orzeszków ziemnych. Na podstawie tego założenia można zapisać proste równanie liniowe i przedstawić je na wykresach.
Narysuj linię reprezentującą liniowe równanie tej prognozy. Porównaj linię z faktycznym zbiorem danych w swojej obserwacji. Oblicz współczynnik determinacji, aby zapewnić miarę dokładności przewidywanego zachowania w porównaniu z rzeczywistymi danymi.
Współczynnik determinacji wskazuje wielkość rozprzestrzeniania się danych wokół linii. Pokazuje, jak dobre lub złe było przewidywanie w porównaniu z rzeczywistymi wartościami. Współczynnik determinacji pozwala użytkownikom zastosować „kontrolę rzeczywistości” do danych zaproponowanych w modelu statystycznym. Istnieją dwie wartości, wartości obserwowane lub rzeczywiste oraz wartości modelowane lub prognozowane.
Ten rodzaj analizy statystycznej jest bardzo powszechny w nauce i biznesie. Wiele decyzji biznesowych opiera się na prognozach dotyczących przyszłych zachowań. Ważne jest, aby przeanalizować rzeczywiste wyniki i porównać je z przewidywaniami. Ten proces poprawia następny model, a tym samym dokładność prognoz.