Co je to jednoduchá lineární regrese?
Jednoduchá lineární regrese se vztahuje na statistiky a pomáhá popsat (x, y) data, která se zdá, že mají lineární vztah, což umožňuje určitou předpověď Y, pokud je známa x. Tato data jsou často vykreslena na rozptylu a vzorec pro lineární regresi vytváří čáru, která nejlépe vyhovuje všem bodům, pokud mají skutečně lineární korelaci. Nepřídí se přesně všechny body, ale měla by to být řádek, kde součet čtverců rozdílu mezi skutečnými daty a očekávanými daty (zbytky) vytváří nejnižší číslo, které se často nazývá linie nejmenších čtverců nebo linie nejlépe fit. Rovnice řádku pro údaje o vzorcích a údaje o populaci jsou následující: ŷ = b 0 + B 1 x a y = b 0 + B 1 x.
Kdokoli, kdo je obeznámen s algebroue nebo m. Důvodem tohoto přeskupení je, že se pak stává elegantně snadné přidat další termíny s funkcemi, jako jsou exponenty, které by mohly popisovat různé nelineární formy vztahu.
Vzorec pro získání jednoduché lineární regresní linie jsou relativně složité a těžkopádné a většina lidí netráví mnoho času psaním, protože to trvá dlouho. Místo toho mohou různé programy, například pro Excel® nebo pro mnoho typů vědeckých kalkulaček, snadno vypočítat linii nejmenších čtverců. Linka je vhodná pouze pro predikci, pokud existuje jasný důkaz silné korelace mezi sadami dat (x, y). Kalkulačka vygeneruje čáru, bez ohledu na to, zda má smysl ji používat.
Současně je generována jednoduchá rovnice lineární regresní linie, lidé se musí dívat na úroveň korelace. To znamená hodnocení r, korelusKoeficient atoru, proti tabulce hodnot, aby se určilo, zda existuje lineární korelace. Navíc hodnocení dat jejich vynesením jako rozptylu je dobrý způsob, jak získat smysl, pokud mají data lineární vztah.
Co se pak lze udělat pomocí jednoduché lineární regresní linie, pokud má lineární korelaci, je, že hodnoty lze nahradit do x, aby se získala předpovídaná hodnota pro ŷ. Tato předpověď má své limity. Přítomné údaje, zejména pokud se jedná pouze o vzorek, mohou mít nyní lineární korelaci, ale nemusí později s přidáním dalšího vzorkovacího materiálu.
Střídavě může celý vzorek sdílet korelaci, zatímco celá populace ne. Predikce je proto omezená a přesahující dostupné hodnoty dat se nazývá extrapolace a není podporována. Navíc, pokud by lidé věděli, že pokud neexistuje lineární korelace, nejlepším odhadem X je průměr všech dat Y.
V podstatě je jednoduchá lineární regrese užitečnou statistickou TOOL, který lze s diskrétností použít k predikci ŷ hodnot založených na hodnotě x. Téměř vždy se učí myšlenkou lineární korelace, protože stanovení užitečnosti regresní linie vyžaduje analýzu r. Naštěstí s mnoha moderními technickými programy mohou lidé grafovat rozptyly, přidat regresní linie a určit korelační koeficient R s několika záznamy.