Co je koeficient determinace?
Koeficient určení je matematický výpočet druhé mocniny korelačního koeficientu. Korelační koeficient je výpočet přesnosti modelu. Tyto termíny se používají ve statistické analýze k vysvětlení poměrně logických výpočtů.
Ve statistice je úkolem analytika podívat se na data shromážděná z konkrétního scénáře nebo události a vytvořit matematický model, který data vysvětluje. K vytvoření tohoto modelu je třeba vzít v úvahu určitá fakta.
Při každém výpočtu a shromažďování údajů existuje možnost chyby. Protože je to konzistentní, musí být do modelu začleněna míra chyb. Zohledněním této chyby přestává být relevantní pro určení, zda navrhovaný model poskytuje důkladné vysvětlení údajů.
Skutečný koeficient stanovení výpočtu je
R 2 = Součet čtverců chyb
Součet čtvercových chyb + regresní součet čtverců
Koeficient determinace je výpočet přesnosti modelu při vysvětlování dat.
Při statistické analýze tato hodnota poskytuje vhled do „dobrého souladu“ statistického modelu s údaji. Hodnota koeficientu je mezi 0 a 1. Dokonalé přizpůsobení modelu pro vysvětlení variace je 1 a 0 je hodnota, když model vůbec nevysvětluje variaci.
Koeficient určení zohledňuje chyby s daty nebo odlehlými hodnotami a regresní součet čtverců. Neexistuje žádná jednotka k této hodnotě, protože je v podstatě poměr a je zcela nesouvisející s velikostí vzorku. Čím vyšší je tato hodnota, blíží se 1, tím lepší je varianta modelu.
Jednoduchý způsob, jak vizualizovat tento koncept, je vytvořit graf všech dat obklopujících konkrétní událost. Položte tři podnosy cookies v obědové místnosti, čokoládu, mandle a arašídy. Sledujte, jak lidé přicházejí do obědové místnosti, a napište, kolik cookies si berou, jaké druhy a v jakém pořadí. Vyneseme tato data do grafu.
Vytvořte vzorec kolem předpokládaného chování. Příkladem by bylo předpovědět, že každý, kdo vzal 1 čokoládový cookie, vzal také 2 mandle, ale ne arašídy. Na základě tohoto předpokladu může být napsána jednoduchá lineární rovnice a grafována.
Vykreslete čáru, která představuje lineární rovnici této predikce. Porovnejte řádek se skutečným sběrem dat ve vašem pozorování. Vypočítejte koeficient určení tak, aby poskytoval míru přesnosti předpokládaného chování ve srovnání se skutečnými údaji.
Koeficient určení udává množství šíření dat kolem čáry. Ukazuje, jak dobrá nebo špatná předpověď byla ve srovnání se skutečnými hodnotami. Koeficient určení umožňuje uživatelům použít „kontrolu reality“ na data navržená ve statistickém modelu. Existují dvě hodnoty, pozorované nebo skutečné hodnoty a modelované nebo predikované hodnoty.
Tento typ statistické analýzy je velmi běžný v oblasti vědy a podnikání. Mnoho obchodních rozhodnutí je založeno na předpovědích budoucího chování. Je důležité analyzovat skutečné výsledky a porovnat je s předpovědi. Tento proces zlepšuje další model a tím i přesnost předpovědí.