Wat is variantieanalyse?
Bij onderzoek wordt het soms nodig om gegevens te analyseren waarbij meer dan twee monsters of groepen worden vergeleken. Een type inferentiële statistiektest, variantieanalyse (ANOVA), maakt het mogelijk om meerdere monsters tegelijkertijd te onderzoeken om te bepalen of er een significant verband tussen bestaat. Redenering is identiek aan t-tests, alleen variantieanalyse omvat onafhankelijke variabelen van twee of meer monsters. Verschillen tussen monsters en het verschil binnen één monster worden bepaald. ANOVA is gebaseerd op vier veronderstellingen: het meetniveau, de bemonsteringsmethode, de verdeling van de populatie en de homogeniteit van de variantie.
Om te bepalen of verschillen significant zijn, houdt ANOVA zich bezig met verschillen tussen en binnen de steekproeven. Dit wordt de variantie genoemd. De ANOVA kan uitzoeken of de variantie tussen monsters groter is dan die tussen steekproefleden. Als dit waar blijkt te zijn, worden de verschillen als significant beschouwd.
Het uitvoeren van een ANOVA-test impliceert aanvaarding van bepaalde veronderstellingen. De eerste is dat de onafhankelijke willekeurige steekproefmethode wordt gebruikt en dat de keuze van steekproefleden uit één populatie de keuze van leden uit latere populaties niet beïnvloedt. Afhankelijke variabelen worden voornamelijk gemeten op het interval-ratio-niveau; het is echter mogelijk om de variantieanalyse toe te passen op metingen op ordinaal niveau. Men kan aannemen dat de populatie normaal verdeeld is, hoewel dit niet verifieerbaar is, en populatievarianties hetzelfde zijn, wat betekent dat de populaties homogeen zijn.
De onderzoekshypothese veronderstelt dat ten minste één gemiddelde verschilt van de andere, maar de verschillende middelen worden niet geïdentificeerd als groter of kleiner. Alleen het feit dat er een verschil bestaat, wordt voorspeld. De ANOVA test voor de nulhypothese, wat betekent dat er geen verschil is tussen alle gemiddelde waarden, zodat A = B = C. Dit vereist het instellen van de alfa, verwijzend naar het waarschijnlijkheidsniveau waar de nulhypothese wordt afgewezen.
F-ratio is een teststatistiek die specifiek wordt gebruikt voor variantieanalyse, omdat de F-score aangeeft waar het gebied van afwijzing voor de nulhypothese begint. Ontwikkeld door statisticus Ronald Fisher, is de formule voor F als volgt: F = tussen schatting van de groepsvariantie (MSB) gedeeld door de schatting van de groepsvariantie (MSW), zodat F = MSB / MSW. Elk van de variantieschattingen bestaat uit twee delen - de som van vierkanten (SSB en SSW) en vrijheidsgraden (df). Met behulp van de statistische tabellen voor biologisch, landbouw- en medisch onderzoek kan de alfa worden ingesteld en hierop worden gebaseerd en kan de nulhypothese van geen verschil worden verworpen. Geconcludeerd kan worden dat er een significant verschil bestaat tussen alle groepen, als dat het geval is.