Co to jest prosta regresja liniowa?
Prosta regresja liniowa dotyczy statystyk i pomaga opisać dane (x, y), które wydają się mieć związek liniowy, umożliwiając pewne przewidywanie y, jeśli x jest znane. Dane te są często wykreślane na wykresach rozrzutu, a formuła regresji liniowej tworzy linię, która najlepiej pasuje do wszystkich punktów, pod warunkiem, że naprawdę mają korelację liniową. Nie pasuje dokładnie do wszystkich punktów, ale powinna być linią, w której suma kwadratów różnicy między rzeczywistymi danymi a oczekiwanymi danymi (resztkami) tworzy najniższą liczbę, która często nazywana jest linią najmniejszych kwadratów lub linii najlepiej dopasowanej. Równanie linii dla danych przykładowych i danych populacji są następujące: ŷ = B 0 + B 1 X i Y = B 0 + B 1 x.
Każdy, kto zna algebrę, może odnotować podobieństwo tej linii do y = mx + b, a w rzeczywistości dwa są stosunkowo identyczne, z wyjątkiem dwóch terminów po prawej stronie równania są przełączane, tak że B 1 równa się nachyleniu nachyleniae lub m. Powodem tego przegrupowania jest to, że staje się elegancko łatwe do dodania dodatkowych terminów z takimi funkcjami, jak wykładnicy, które mogą opisywać różne nieliniowe formy relacji.
Formuły uzyskania prostej linii regresji liniowej są stosunkowo złożone i uciążliwe, a większość ludzi nie spędza dużo czasu na zapisywaniu ich, ponieważ zajmuje dużo czasu. Zamiast tego różne programy, takie jak Excel® lub dla wielu rodzajów kalkulatorów naukowych, mogą łatwo obliczyć linię najmniejszych kwadratów. Linia jest odpowiednia do przewidywania tylko wtedy, gdy istnieją wyraźne dowody silnej korelacji między zestawami danych (x, y). Kalkulator wygeneruje linię, niezależnie od tego, czy ma sens, aby go używać.
Jednocześnie generowane jest proste równanie linii regresji liniowej, ludzie muszą patrzeć na poziom korelacji. Oznacza to ocenę r, korelwspółczynnik ation, w stosunku do tabeli wartości w celu ustalenia, czy istnieje korelacja liniowa. Ponadto ocena danych poprzez wykreślenie ich jako wykresu rozrzutu jest dobrym sposobem na uzyskanie sensu, jeśli dane mają związek liniowy.
To, co można następnie zrobić za pomocą prostej linii regresji liniowej, pod warunkiem, że ma korelację liniową, polega na tym, że wartości można zastąpić x, aby uzyskać przewidywaną wartość dla ŷ. Ta prognoza ma swoje granice. Dane obecne, szczególnie jeśli są to tylko próbka, mogą teraz mieć korelację liniową, ale mogą nie później dodać dodatkowy materiał próbki.
Alternatywnie cała próbka może dzielić korelację, podczas gdy cała populacja nie. Prognozowanie jest zatem ograniczone, a wykraczanie daleko poza dostępne wartości danych nazywa się ekstrapolacją i nie jest zachęcana. Ponadto ludzie powinni wiedzieć, że jeśli nie istnieje korelacja liniowa, najlepszym oszacowaniem x jest średnia wszystkich danych Y.
Zasadniczo prosta regresja liniowa jest użytecznym statystycznym tOOL, który z uznaniem można użyć do przewidywania wartości ŷ na podstawie wartości x. Prawie zawsze jest nauczany z ideą korelacji liniowej, ponieważ określanie przydatności linii regresji wymaga analizy r. Na szczęście w przypadku wielu nowoczesnych programów technicznych ludzie mogą wykazywać wykresy rozrzutu, dodawać linie regresji i określać współczynnik korelacji R z kilkoma wpisami.