Vad är en bestämningskoefficient?
Bestämningskoefficienten är en matematisk beräkning av kvadratet för en korrelationskoefficient. Korrelationskoefficienten är en beräkning av modellens noggrannhet. Dessa termer används i statistisk analys för att förklara ganska logiska beräkningar.
I statistik är en analytikers jobb att titta på data som samlas in från ett specifikt scenario eller händelse och skapa en matematisk modell som förklarar data. För att skapa denna modell finns det vissa fakta som måste beaktas.
Det finns en möjlighet till fel i varje beräkning och insamling av data. Eftersom detta är konsekvent måste felfrekvensen integreras i modellen. Genom att redovisa detta fel upphör det att vara relevant för att avgöra om den föreslagna modellen ger en solid förklaring till uppgifterna.
Den faktiska beräkningskoefficienten för bestämning är
R 2 = Summan av kvadratfelen
Summan av kvadratfelen + regressionssumma av kvadrater
Bestämningskoefficienten är en beräkning av modellens noggrannhet för att förklara data.
Detta värde används i statistisk analys och ger insikt i den "goda anpassningen" för den statistiska modellen till data. Värdet på koefficienten är mellan 0 och 1. En perfekt anpassning för modellen för att förklara variationen är 1 och 0 är värdet när modellen inte förklarar variationen alls.
Bestämningskoefficienten tar hänsyn till fel med data, eller outliers, och regressionssumman för kvadrater. Det finns ingen enhet till detta värde, eftersom det i allt väsentligt är ett förhållande och är helt oberoende av provets storlek. Ju högre värde närmar sig 1, desto bättre förklaring av variationen tillhandahålls av modellen.
Ett enkelt sätt att visualisera detta koncept är att skapa en graf över alla data som omger en viss händelse. Ställ ut tre brickor med kakor i ett lunchrum, choklad, mandel och jordnötter. Observera när folk kommer in i lunchrummet och skriv ner hur många kakor de tar, vilka slag och i vilken ordning. Plotta dessa data på en graf.
Skapa en formel kring det förutsagda beteendet. Ett exempel skulle vara att förutsäga att varje person som tog en chokladkaka också tog 2 mandlar, men ingen jordnötter. En enkel linjär ekvation kan skrivas utifrån detta antagande och diagramas.
Rita upp linjen som representerar den linjära ekvationen för den förutsägelsen. Jämför raden med den faktiska datainsamlingen i din observation. Beräkna bestämningskoefficienten för att ge ett mått på noggrannheten för det förutsagda beteendet jämfört med de faktiska uppgifterna.
Bestämningskoefficienten anger mängden spridning av data runt linjen. Det visar hur bra eller dålig förutsägelsen var i jämförelse med de verkliga värdena. Bestämningskoefficienten tillåter användare att tillämpa en "verklighetskontroll" på de data som föreslås i en statistisk modell. Det finns två värden, de observerade eller faktiska värdena och de modellerade eller förutspådda värdena.
Denna typ av statistisk analys är mycket vanligt är vetenskapen och inom näringslivet. Många affärsbeslut är baserade på förutsägelser om framtida beteende. Det är viktigt att analysera de faktiska resultaten och jämföra dem med förutsägelserna. Denna process förbättrar nästa modell och därför noggrannheten i förutsägelserna.