Co to jest wariancja?
Wariancja, podobnie jak zakres, jest statystyką związaną z rozprzestrzenianiem się danej próbki lub populacji. Jest on obliczany dla danej populacji poprzez zsumowanie kwadratów różnicy między każdym elementem a średnią, a następnie podzielenie tej sumy przez liczbę elementów w populacji. Im ściślej populacja jest skupiona wokół średniej, tym mniejsza będzie wariancja.
Blisko powiązaną statystyką jest odchylenie standardowe, które jest pierwiastkiem kwadratowym wariancji. Odchylenie standardowe jest częściej stosowane w statystyce opisowej, ponieważ jest bardziej intuicyjne i dzieli te same jednostki co średnia. W rozkładzie normalnym, który jest klasyczną krzywą w kształcie dzwonu, wspólną dla wielu zjawisk, nieco ponad 95 procent populacji będzie mieścić się w dwóch standardowych odchyleniach średniej.
Wariancja jest najbardziej użyteczna w przypadku predykcyjnych technik statystycznych, takich jak regresja lub analiza wariancji (ANOVA). Regresja zamodeluje zmienną jako sumę jednego lub więcej czynników, które wpływają na zmienną i wariancję, która reprezentuje różnicę między faktycznie obserwowanymi elementami a ich oczekiwanymi wartościami. Na przykład zatrudnienie w budownictwie w mieście może być modelowane jako poziom podstawowy, plus korekta sezonowa o porę roku oraz korekta dla gospodarki narodowej plus wariancja. Techniki regresji próbują ustalić model o najmniejszej wariancji, tak aby oczekiwana wartość prognozy była bliska wartości obserwowanej po możliwej obserwacji.
ANOVA, powszechnie stosowana w badaniach klinicznych, jest techniką statystyczną służącą do klasyfikacji źródeł wariancji. Obserwacje są podzielone na kategorie według jednego lub więcej interesujących czynników w eksperymencie. Techniki najmniejszych kwadratów są stosowane do podziału wariancji na błąd losowy, efekty czynnikowe i efekty interakcji, w celu ustalenia wpływu, jaki czynnik lub czynniki mają na zmienną. Na przykład firma, która testuje nowy nawóz, może wykorzystać eksperyment ANOVA z plonem jako badaną zmienną oraz czynniki, które używał nawozu i ile opadów otrzymały plony. Jak nowy nawóz w porównaniu z innymi nawozami byłby czynnikiem wpływającym na eksperyment; jeśli nowy nawóz przewyższyłby swoich rywali o standardowe opady, ale nie o duże opady, byłby to przykład efektu interakcji.