Hvad er simpel lineær regression?
Enkel lineær regression gælder for statistik og hjælper med at beskrive (x, y) data, der ser ud til at have et lineært forhold, hvilket giver mulighed for en vis forudsigelse af y, hvis x er kendt. Disse data er ofte afbildet på scatterplots, og formlen for lineær regression skaber en linje, der bedst passer til alle punkterne, forudsat at de virkelig har en lineær korrelation. Det passer ikke nøjagtigt til alle punkterne, men det skal være en linje, hvor summen af firkanterne af forskellen mellem faktiske data og forventede data (rester) skaber det laveste antal, der ofte kaldes den mindste firkanter linje eller linje med bedste pasform. Ligningen af linjen for eksempeldata og populationsdata er følgende: ŷ = B 0 + B 1 x og y = b 0 + b 1 x.
Enhver, der er bekendt med algebra, kan bemærke ligheden af denne linje til y = mx + b, og faktisk er de to relativt identiske, undtagen de to udtryk på højre side af ligningen er skiftet, så B 1 er lig med skråe eller m. Årsagen til denne omarrangement er, at den derefter bliver elegant let at tilføje yderligere udtryk med funktioner såsom eksponenter, der muligvis beskriver forskellige ikke -lineære former for forhold.
Formlerne til at få en simpel lineær regressionslinie er relativt komplekse og besværlige, og de fleste mennesker bruger ikke meget tid på at skrive disse ned, fordi de tager lang tid at gennemføre. I stedet kan forskellige programmer, såsom for Excel® eller for mange typer videnskabelige regnemaskiner, let beregne en mindstekvadratlinje. Linjen er kun passende til forudsigelse, hvis der er klare beviser for en stærk sammenhæng mellem sæt (x, y) data. En lommeregner genererer en linje, uanset om det giver mening at bruge den.
Samtidig genereres en simpel lineær regressionslinie ligning, folk skal se på korrelationsniveau. Dette betyder at evaluere R, korrelenationskoefficient, mod en værdi tabel for at bestemme, om der findes lineær korrelation. Derudover er evaluering af dataene ved at plotte dem som en scatterplot en god måde at få en fornemmelse af, hvis data har et lineært forhold.
Hvad der så kan gøres med en simpel lineær regressionslinje, forudsat at den har en lineær korrelation, er, at værdier kan erstattes i X for at få en forudsagt værdi for ŷ. Denne forudsigelse har sine grænser. De tilstedeværende data, især hvis det kun er en prøve, kan have en lineær korrelation nu, men måske ikke senere med yderligere prøvemateriale tilsat.
Alternativt kan en hel prøve dele en sammenhæng, mens en hel befolkning ikke gør det. Forudsigelse er derfor begrænset, og at gå langt ud over de tilgængelige dataværdier kaldes ekstrapolering og tilskyndes ikke. Skulle folk desuden vide, at hvis der ikke findes nogen lineær korrelation, er det bedste estimat af X gennemsnittet af alle Y -data.
I det væsentlige er enkel lineær regression en nyttig statistisk tOOL, der med skøn kan bruges til at forudsige ŷ -værdier baseret på en X -værdi. Det undervises næsten altid med ideen om lineær korrelation, da bestemmelse af nytten af en regressionslinje kræver analyse af r. Heldigvis med mange moderne tekniske programmer kan folk grafer scatterplots, tilføje regressionslinjer og bestemme korrelationskoefficient R med et par poster.