Vad är enkel linjär regression?

Enkel linjär regression gäller statistik och hjälper till att beskriva (x, y) data som verkar ha en linjär relation, vilket möjliggör viss förutsägelse av y om x är känt. Dessa data plottas ofta på spridplotter och formeln för linjär regression skapar en linje som bäst passar alla punkter, förutsatt att de verkligen har en linjär korrelation. Det passar inte exakt alla punkter, men det borde vara en linje där summan av kvadraterna av skillnaden mellan faktiska data och förväntade data (rester) skapar det lägsta antalet, som ofta kallas den minsta kvadraten linje eller linje av bästa passform. Ekvationen för raden för provdata och populationsdata är följande: ŷ = b 0 + b 1 x och Y = B 0 + B 1 x.

Alla som är bekanta med algebra kan notera att denna linje liknar y = mx + b, och i själva verket är de två relativt identiska, förutom att de två termerna på höger sida av ekvationen är omkopplade, så att B1 är lika med lutningen eller m. Anledningen till omarrangemanget är att det då blir elegant lätt att lägga till ytterligare termer med funktioner som exponenter som kan beskriva olika olinjära förhållanden.

Formlerna för att få en enkel linjär regressionslinje är relativt komplexa och besvärliga, och de flesta människor lägger inte mycket tid på att skriva ner dessa eftersom de tar lång tid att slutföra. Istället kan olika program, till exempel för Excel® eller för många typer av vetenskapliga kalkylatorer, enkelt beräkna en minst kvadratrad. Linjen är endast lämplig för förutsägelse om det finns tydliga bevis på en stark korrelation mellan uppsättningarna (x, y) data. En räknare kommer att generera en rad, oavsett om det är vettigt att använda den.

Samtidigt genereras en enkel linjär regressionslinjeekvation, människor måste titta på korrelationsnivå. Detta innebär att utvärdera r, korrelationskoefficienten, mot en värdetabell för att bestämma om linjär korrelation finns. Utvärdering av data genom att plotta den som en spridningsdiagram är dessutom ett bra sätt att få mening om data har en linjär relation.

Vad som sedan kan göras med en enkel linjär regressionslinje, förutsatt att den har en linjär korrelation, är att värden kan ersättas till x för att få ett förutsagt värde för ŷ. Denna förutsägelse har sina gränser. Uppgifterna, särskilt om det bara är ett prov, kan ha en linjär korrelation nu, men kanske inte senare med ytterligare provmaterial tillagd.

Alternativt kan ett helt prov dela en korrelation medan en hel population inte gör det. Förutsägelse är därför begränsad, och att gå långt utöver tillgängliga datavärden kallas extrapolering och uppmuntras inte. Skulle människor veta att om det inte finns någon linjär korrelation, är den bästa uppskattningen av x medelvärdet av alla y-data.

I grund och botten är enkel linjär regression ett användbart statistiskt verktyg som med diskretion kan användas för att förutsäga ŷ-värden baserade på axvärdet. Det lärs nästan alltid ut med idén om linjär korrelation eftersom att bestämma användbarheten av en regressionslinje kräver analys av r. Lyckligtvis med många moderna tekniska program kan människor diagram spridplotter, lägga till regressionslinjer och bestämma korrelationskoefficient r med ett par poster.

ANDRA SPRÅK

Hjälpte den här artikeln dig? Tack för feedbacken Tack för feedbacken

Hur kan vi hjälpa? Hur kan vi hjälpa?