Wat is een afwijking?
Variantie, zoals bereik, is een statistiek gerelateerd aan de verspreiding van een bepaalde steekproef of populatie. Het wordt berekend voor een bepaalde populatie door de kwadraten van het verschil tussen elk element en het gemiddelde op te tellen en dat totaal vervolgens te delen door het aantal elementen in de populatie. Hoe strakker een populatie rond het gemiddelde is geclusterd, hoe lager de variantie zal zijn.
Een nauw verwante statistiek is de standaarddeviatie, die de vierkantswortel van de variantie is. De standaarddeviatie wordt vaker gebruikt in beschrijvende statistieken omdat deze intuïtiever is en dezelfde eenheden als het gemiddelde deelt. In de normale verdeling, die de klassieke klokvormige verdelingskromme is die veel fenomenen gemeen hebben, zal iets meer dan 95 procent van de bevolking binnen twee standaarddeviaties van het gemiddelde liggen.
Variantie is het meest bruikbaar voor voorspellende statistische technieken zoals regressie of variantieanalyse (ANOVA). Regressie zal een variabele modelleren als de som van een of meer factoren die de variabele en de variantie beïnvloeden, hetgeen het verschil vertegenwoordigt tussen de feitelijk waargenomen elementen en hun verwachte waarden. De werkgelegenheid in de bouw in een stad kan bijvoorbeeld worden gemodelleerd als een basisniveau, plus een seizoenscorrectie voor de tijd van het jaar, plus een correctie voor de nationale economie, plus de variantie. Regressietechnieken proberen een model met de kleinste variantie te bepalen, zodat de verwachte waarde van de voorspelling hopelijk dicht bij de waargenomen waarde zal liggen nadat observatie mogelijk is.
ANOVA, algemeen gebruikt in klinische proeven, is een statistische techniek om variantiebronnen te classificeren. Observaties worden gecategoriseerd door een of meer interessante factoren in een experiment. De kleinste kwadratentechnieken worden gebruikt om de variantie te verdelen in willekeurige fouten, factoreffecten en interactie-effecten, met als doel de invloed te bepalen die de factor of factoren op de variabele hebben. Een bedrijf dat een nieuwe meststof test, kan bijvoorbeeld een ANOVA-experiment met gewasopbrengst gebruiken als de onderzochte variabele en factoren van welke kunstmest is gebruikt en hoeveel regenval de gewassen hebben ontvangen. Hoe de nieuwe meststof in vergelijking met andere meststoffen een factoreffect zou zijn in het experiment; als de nieuwe meststof zijn rivalen zou overtreffen voor standaard regenval maar niet voor zware regenval, zou dat een voorbeeld zijn van een interactie-effect.