Hvad er analyse af variation?
Når man forsker, bliver det undertiden nødvendigt at analysere data, der sammenligner mere end to prøver eller grupper. En type inferential statistik test, variansanalyse (ANOVA) tillader undersøgelse af flere prøver på samme tid med henblik på at afgøre, om der foreligger et signifikant forhold mellem dem. Begrundelsen er identisk med t-tests, kun analyse af variansen inkluderer uafhængige variabler af to eller flere prøver. Forskelle mellem prøver såvel som forskellen inden for en prøve bestemmes. ANOVA er baseret på fire antagelser: målingsniveauet, prøveudtagningsmetoden, fordelingen af populationen og homogeniteten i variationen.
For at bestemme, om forskelle er signifikante, angår ANOVA forskelle mellem og inden for prøverne, der benævnes variansen. ANOVA kan finde ud af, om afvigelsen er større mellem prøver sammenlignet med den blandt prøvemedlemmer. Hvis dette viser sig at være sandt, betragtes forskellene som betydelige.
At gennemføre en ANOVA-test involverer accept af visse antagelser. Den første er, at den uafhængige tilfældige prøveudtagningsmetode bruges, og valget af prøvemedlemmer fra en enkelt population påvirker ikke valget af medlemmer fra senere populationer. Afhængige variabler måles primært ved intervalforholdsniveauet; det er dog muligt at anvende variansanalysen på målinger på ordinalt niveau. Man kan antage, at befolkningen normalt er fordelt, selvom dette ikke kan verificeres, og befolkningsafvigelser er de samme, hvilket betyder, at befolkningen er homogen.
Forskningshypotesen antager, at mindst et middel er forskelligt fra de andre, men de forskellige midler identificeres ikke som større eller mindre. Kun det faktum, at der eksisterer en forskel, er forudsagt. ANOVA tester for nulhypotesen, hvilket betyder, at der ikke er nogen forskel mellem alle middelværdier, således at A = B = C. Dette kræver indstilling af alfa under henvisning til sandsynlighedsniveauet, hvor nulhypotesen vil blive afvist.
F-forhold er en teststatistik, der specifikt bruges til analyse af varians, da F-score viser, hvor området med afvisning for nulhypotesen begynder. Udviklet af statistikeren Ronald Fisher er formlen for F som følger: F = mellem gruppevariansestimat (MSB) divideret med inden for gruppevariansestimatet (MSW), således at F = MSB / MSW. Hver af variansestimaterne består af to dele - summen af kvadrater (SSB og SSW) og frihedsgrader (df). Ved hjælp af de statistiske tabeller til biologisk, landbrugs- og medicinsk forskning kan alfa indstilles og baseres på dette, og nullhypotesen om ingen forskel kan afvises. Det kan konkluderes, at der er en betydelig forskel mellem alle grupperne, hvis dette er tilfældet.