Che cos'è una varianza?
La varianza, come l'intervallo, è una statistica correlata alla diffusione di un dato campione o popolazione. Viene calcolato per una determinata popolazione sommando i quadrati della differenza tra ciascun elemento e la media, quindi dividendo quel totale per il numero di elementi nella popolazione. Più strettamente una popolazione è raggruppata attorno alla media, minore sarà la varianza.
Una statistica strettamente correlata è la deviazione standard, che è la radice quadrata della varianza. La deviazione standard è più frequentemente utilizzata nelle statistiche descrittive perché è più intuitiva e condivide le stesse unità della media. Nella distribuzione normale, che è la classica curva di distribuzione a forma di campana comune a molti fenomeni, poco più del 95 percento della popolazione si troverà all'interno di due deviazioni standard della media.
La varianza è molto utile per le tecniche statistiche predittive come la regressione o l'analisi della varianza (ANOVA). La regressione modellerà una variabile come la somma di uno o più fattori che influenzano la variabile e la varianza, che rappresenta la differenza tra gli elementi osservati effettivi e i loro valori previsti. Ad esempio, l'occupazione nelle costruzioni in una città potrebbe essere modellata come un livello base, oltre a un adeguamento stagionale per il periodo dell'anno, oltre a un adeguamento per l'economia nazionale, oltre alla varianza. Le tecniche di regressione tentano di determinare un modello con la varianza minima, in modo che il valore atteso della previsione si spera sia vicino al valore osservato dopo che è possibile l'osservazione.
L'ANOVA, comunemente usato negli studi clinici, è una tecnica statistica per classificare le fonti di varianza. Le osservazioni sono classificate in base a uno o più fattori di interesse in un esperimento. Le tecniche dei minimi quadrati sono utilizzate per suddividere la varianza in errori casuali, effetti fattoriali ed effetti di interazione, con l'obiettivo di determinare l'influenza che il fattore oi fattori hanno sulla variabile. Ad esempio, un'azienda che sta testando un nuovo fertilizzante potrebbe utilizzare un esperimento ANOVA con la resa delle colture come variabile studiata e fattori di quale fertilizzante è stato utilizzato e quante precipitazioni hanno ricevuto le colture. In che modo il nuovo fertilizzante rispetto ad altri fertilizzanti sarebbe un fattore determinante nell'esperimento; se il nuovo fertilizzante superasse i suoi concorrenti per le piogge standard ma non per le piogge intense, questo sarebbe un esempio di effetto di interazione.