Hva er variansanalyse?
Når du forsker, blir det noen ganger nødvendig å analysere data som sammenligner mer enn to prøver eller grupper. En type inferential statistisk test, variansanalyse (ANOVA), tillater undersøkelse av flere prøver samtidig for å bestemme om det foreligger et betydelig forhold mellom dem. Resonnementet er identisk med t-tester, bare variansanalyse inkluderer uavhengige variabler av to eller flere prøver. Forskjeller mellom prøver så vel som forskjellen innen en prøve bestemmes. ANOVA er basert på fire forutsetninger: målingsnivået, prøvetakingsmetoden, fordelingen av populasjonen og homogeniteten til variansen.
For å avgjøre om forskjeller er signifikante, er ANOVA opptatt av forskjeller mellom og innenfor prøvene, som omtales som variansen. ANOVA kan finne ut om variansen er større mellom prøvene sammenlignet med den blant prøvemedlemmene. Hvis dette blir funnet å være sant, anses forskjellene å være betydelige.
Å gjennomføre en ANOVA-test innebærer aksept av visse forutsetninger. Den første er at den uavhengige tilfeldige prøvetakingsmetoden brukes, og valget av utvalgte medlemmer fra en enkelt populasjon ikke påvirker valget av medlemmer fra senere populasjoner. Avhengige variabler måles hovedsakelig ved intervall-forholdsnivået; Det er imidlertid mulig å anvende variansanalysen på målinger på ordinært nivå. Man kan anta at befolkningen normalt er fordelt, selv om dette ikke er etterprøvbart, og befolkningsavvik er de samme, noe som betyr at populasjonene er homogene.
Forskningshypotesen forutsetter at minst ett middel er forskjellig fra de andre, men de forskjellige midlene er ikke identifisert som større eller mindre. Bare det at en forskjell eksisterer, er spådd. ANOVA tester for nullhypotesen, noe som betyr at det ikke er noen forskjell mellom alle middelverdiene, slik at A = B = C. Dette krever innstilling av alfa, med henvisning til sannsynlighetsnivået der nullhypotesen vil bli avvist.
F-forholdet er en teststatistikk brukt spesielt for analyse av varians, da F-poengsummen viser hvor avvisningsområdet for nullhypotesen begynner. Utviklet av statistikeren Ronald Fisher, er formelen for F som følger: F = mellom gruppevariansestimat (MSB) dividert med gruppevariansestimatet (MSW), slik at F = MSB / MSW. Hver av variansestimatene består av to deler - summen av kvadrater (SSB og SSW) og frihetsgrader (df). Ved å bruke de statistiske tabellene for biologisk, landbruks- og medisinsk forskning , kan alfa stilles og baseres på dette, og nullhypotesen om ingen forskjell kan avvises. Det kan konkluderes med at det foreligger en betydelig forskjell mellom alle gruppene, hvis det er tilfelle.