Hvad er en linje, der passer bedst?
I matematik er linjen med bedste pasform en linje, der kan tegnes, der angår punkterne i et scatter-plot af data. Spredningsdiagrammer laves, når to egenskaber ved noget er relateret, som dagen og den høje temperatur for dagen. Linjen med bedste pasform beskriver bedst punkterne på et spredningsdiagram, når den gennemsnitlige forskel mellem hvor linien trækkes og det nærmeste punkt er mindst. Dette er let at kontrollere med den mindst firkantede metode. Ligninger bruges undertiden til at beskrive linjerne som en funktion, når kun et punkt vil forholde sig til et punkt på linjen med den bedste pasform.
Det er vigtigt at forstå, at alle linjer har en hældning og en opsamling. Hældningen beskriver, hvor hurtigt linjen skifter mellem to forhold. Afskærmningen beskriver et punkt, hvor en del af forholdet bliver nul, hvis linjen blev udvidet til det punkt.
Det er nyttigt at udvikle en god passende linje, fordi det giver mulighed for forudsigelser, når data ikke præsenteres. Hvis kun to punkter er afbildet, kan kun en linje tegnes med en lineal som en lige linje mellem de to punkter. Med kun to punkter er linjen med bedste pasform nøjagtig og behøver ikke at kontrolleres. Det kan nu vise den nøjagtige placering af et forhold, der vil lande mellem de to punkter.
Et spredningsdiagram over to forhold er, hvordan de fleste data registreres i statistikker. De fleste scatter-plots har mange point, og at bruge en lineal til at tegne en linje med den bedste pasform er ikke længere den rette teknik. Hvis forholdet betragtes som først bestilt, vil linjen med bedste pasning stadig være en lige linje, men denne linje behøver ikke at røre ved nogen punkter.
Den mindst kvadratiske metode bestemmer, om en linje vil passe til dataene bedre end en anden. Det gør dette ved at se, om forskellen mellem hvert afbildede punkt og det punkt, linjen forudsiger, er den mindste mulige forskel. Gennemsnittet af forskellene giver et tal, der repræsenterer, hvor godt linjen passer til dataene. Andre linjer får muligvis en lavere værdi og bliver den nye linje, der passer bedst til en proces kaldet lineær regression.
Ikke hver linje er en lige linje, mange er kurver og endda tredimensionelle. Multipel lineær regression er den statistiske teknik, der bruges til at finde en linje, der passer bedst til data, der ikke følger en lige linje. Regression refererer til kurve- og overflademontering, men selv for disse meget hårdere anvendelser af linjen med bedste pasform bruges den mindst kvadratiske metode stadig til at kontrollere og sammenligne resultater.