Vad är enkel linjär regression?

Enkel linjär regression gäller för statistik och hjälper till att beskriva (x, y) data som verkar ha en linjär relation, vilket möjliggör en viss förutsägelse av y om x är känd. Dessa data är ofta ritade på spridningsplott och formeln för linjär regression skapar en linje som bäst passar alla punkter, förutsatt att de verkligen har en linjär korrelation. Det passar inte exakt alla punkter, men det borde vara en linje där summan av kvadrarna av skillnaden mellan faktiska data och förväntade data (rester) skapar det lägsta antalet, som ofta kallas den minsta kvadratlinjen eller linjen för bästa passform. Ekvationen för linjen för provdata och populationsdata är följande: ŷ = b 0 + b 1 x och y = b 0 + b 1 x.

Den som är bekanta med algebra kan notera likheten mellan denna linje med y = mx + b, och i själva verket är de två relativt identiska, förutom att de två termerna på höger sida av ekvationen byts, så att b 1 är lika med slope eller m. Anledningen till denna omarrangemang är att det blir elegant lätt att lägga till ytterligare termer med funktioner som exponenter som kan beskriva olika olinjära former av relation.

Formlerna för att få en enkel linjär regressionslinje är relativt komplexa och besvärliga, och de flesta människor lägger inte mycket tid på att skriva ner dessa eftersom de tar lång tid att slutföra. Istället kan olika program, till exempel för Excel® eller för många typer av vetenskapliga kalkylatorer, enkelt beräkna en minsta kvadrater. Linjen är endast lämplig för förutsägelse om det finns tydliga bevis på en stark korrelation mellan uppsättningarna (x, y) -data. En räknare kommer att generera en linje, oavsett om det är vettigt att använda den.

Samtidigt genereras en enkel linjär regressionslinjeekvation, människor måste titta på korrelationsnivån. Detta innebär att utvärdera R, korrelationskoefficient, mot en tabell över värden för att bestämma om linjär korrelation finns. Dessutom är det ett bra sätt att få en linjär relation att utvärdera data genom att plotta dem som en spridningsplatt.

Det som sedan kan göras med en enkel linjär regressionslinje, förutsatt att den har en linjär korrelation, är att värden kan ersättas i x för att få ett förutsagt värde för ŷ. Denna förutsägelse har sina gränser. Uppgifterna, särskilt om det bara är ett prov, kan ha en linjär korrelation nu, men kanske inte senare med ytterligare provmaterial tillagda.

växelvis kan ett helt prov dela en korrelation medan en hel befolkning inte gör det. Förutsägelsen är därför begränsad, och att gå långt utöver de tillgängliga datavärdena kallas extrapolering och uppmuntras inte. Om människor vet att om det inte finns någon linjär korrelation är den bästa uppskattningen av X medelvärdet för alla y -data.

I huvudsak är enkel linjär regression en användbar statistisk tOOL som med diskretion kan användas för att förutsäga ŷ -värden baserat på ett x -värde. Det lärs nästan alltid med idén om linjär korrelation eftersom bestämning av användbarheten av en regressionslinje kräver analys av R. Lyckligtvis med många moderna tekniska program kan människor grafera spridningsplott, lägga till regressionslinjer och bestämma korrelationskoefficient R med ett par poster.

ANDRA SPRÅK

Hjälpte den här artikeln dig? Tack för feedbacken Tack för feedbacken

Hur kan vi hjälpa? Hur kan vi hjälpa?