Cos'è una curva di distribuzione di frequenza?
Una curva di distribuzione della frequenza è un tipo di statistiche descrittive rappresentate come un grafico che dimostra la frequenza del verificarsi di una data variabile, in cui x rappresenta una misura del verificarsi della variabile e y rappresenta il numero di casi ad ogni frequenza. Con popolazioni molto grandi, si dice che una curva di distribuzione di frequenza assomiglia all'ideale statistico di una curva a campana e assume le proprietà di una distribuzione normale. La curva a campana - nota anche come una curva normale - è appropriatamente denominata. Assomiglia a una campana arrotondata con estremità simmetriche che si assottigliano e si allontanano verso una frequenza zero all'asse X. La curva a campana è bisettata dalla media identica idealizzata (μ), mediana e modalità di tutti i dati misurati, con metà di ciascun grafico su entrambi i lati.
Quando si presume che una curva di distribuzione della frequenza del campione possieda le proprietà di una curva a campana ideale, quindi gli aspetti della popolazione in studio possono essere assunti anche come. In addizione, formule statistiche standard possono dare un grado a cui tali ipotesi possono essere invocati. Con la curva a campana ideale, si presume che la media, la mediana e la modalità di una popolazione siano uguali. Il calcolo della deviazione standard, σ, fornisce quindi una misura della "diffusione" dei dati della popolazione. Nella curva ideale, tutti tranne lo 0,25 percento dei dati totali di una popolazione si trovano all'interno di più o meno tre deviazioni standard dalla media della curva di distribuzione della frequenza, o tra μ-3σ e μ+3σ.
Mentre la curva a campana ideale differisce da una curva di distribuzione della frequenza del campione in vari modi, consente una comprensione presunta sia della popolazione campione che persino della posizione di una singola misurazione all'interno della popolazione complessiva del campione. In una curva ideale, il 68 percento dei valori per la variabile misurata nel campione e presumibilmente nella popolazione sarà all'interno di una SDeviazione di Tandard dalla media in entrambe le direzioni o μ-1σ e μ+1σ. Muovendosi più lungo la curva a campana, i valori per il 95 percento del campione e la popolazione saranno posizionati all'interno di più o meno due deviazioni standard dalla media o μ-2σ e μ+2σ. Ai bordi stessa della curva di distribuzione della frequenza, tutti tranne lo 0,25 per cento rientrano in più o meno tre deviazioni standard. Quelle rare misurazioni che si trovano nello 0,25 per cento oltre le misure di tre deviazioni standard sono note come valori anomali e vengono spesso rimosse dai dati quando si verificano calcoli inferenziali.