Che cos'è una curva di distribuzione della frequenza?
Una curva di distribuzione della frequenza è un tipo di statistiche descrittive rappresentate come un grafico che dimostra la frequenza dell'occorrenza di una determinata variabile, dove x rappresenta una misura dell'occorrenza della variabile e y rappresenta il numero di casi per ciascuna frequenza. Con popolazioni molto grandi, si dice che una curva di distribuzione di frequenza assomigli all'ideale statistico di una curva a campana e assume le proprietà di una distribuzione normale. La curva a campana - nota anche come curva normale - ha un nome appropriato. Assomiglia a una campana arrotondata con estremità simmetriche che si assottigliano verso il basso e verso l'esterno verso una frequenza zero sull'asse x. La curva della campana è divisa in due dalla media identica idealizzata (μ), mediana e modalità di tutti i dati misurati, con la metà di ciascun grafico su entrambi i lati.
Quando si presume che una curva di distribuzione della frequenza del campione possieda le proprietà di una curva a campana ideale, si possono assumere anche aspetti della popolazione studiata. Inoltre, le formule statistiche standard possono dare un grado in cui tali ipotesi possono essere invocate. Con la curva a campana ideale, si presume che la media, la mediana e la modalità di una popolazione siano uguali. Il calcolo della deviazione standard, σ, quindi fornisce una misura della "diffusione" dei dati sulla popolazione. Nella curva ideale, tutti tranne lo 0,25 percento dei dati totali di una popolazione si trovano entro più o meno tre deviazioni standard dalla media della curva di distribuzione della frequenza, o tra μ-3σ e μ + 3σ.
Mentre la curva a campana ideale differisce da una curva di distribuzione della frequenza del campione in diversi modi, consente una comprensione assunta sia della popolazione del campione sia della posizione di una singola misurazione all'interno della popolazione complessiva del campione. In una curva ideale, il 68 percento dei valori per la variabile misurati nel campione, e presumibilmente nella popolazione, si troverà all'interno di una deviazione standard dalla media in entrambe le direzioni, o μ-1σ e μ + 1σ. Spostandosi ulteriormente lungo la curva della campana, i valori per il 95 percento del campione e la popolazione saranno posizionati entro più o meno due deviazioni standard dalla media, o μ-2σ e μ + 2σ. Ai limiti della curva di distribuzione della frequenza, tutti tranne lo 0,25 percento rientrano in più o meno tre deviazioni standard. Quelle rare misurazioni che si trovano nello 0,25 percento oltre le misurazioni di tre deviazioni standard sono note come valori anomali e vengono spesso rimosse dai dati quando si verificano calcoli inferenziali.