Hvad er en frekvensfordelingskurve?
En frekvensfordelingskurve er en type beskrivende statistik, der er afbildet som en graf, der demonstrerer hyppigheden af en given variabels forekomst, hvor x repræsenterer et mål for variabelens forekomst og y repræsenterer antallet af tilfælde på hver frekvens. Med meget store populationer siges det, at en frekvensfordelingskurve ligner det statistiske ideal for en klokkekurve og antager egenskaberne ved en normal fordeling. Klokkekurven - også kendt som en normal kurve - er passende navngivet. Det ligner en afrundet klokke med symmetriske ender, der tilspidser ned og ud mod en nulfrekvens ved x-aksen. Klokkekurven halveres af det idealiserede identiske middelværdi (μ), median og tilstand for alle de målte data, med halvdelen af hver graf på hver side.
Når en prøvefrekvensfordelingskurve antages at have egenskaberne ved en ideel klokkekurve, kan aspekter af den population, der undersøges, også antages. Derudover kan standardstatistiske formler give en grad, som sådanne antagelser kan være afhængige af. Med den ideelle klokkekurve antages en befolknings gennemsnit, median og tilstand alle at være ens. Beregning af standardafvigelsen σ giver derefter et mål for populationsdataens "spredning". I den ideelle kurve findes alle undtagen 0,25 procent af befolkningens samlede data inden for plus eller minus tre standardafvigelser fra gennemsnittet af frekvensfordelingskurven eller mellem μ-3σ og μ + 3σ.
Mens den ideelle klokkekurve adskiller sig fra en prøvefrekvensfordelingskurve på flere måder, tillader den en vis antagelig forståelse af både prøvepopulationen og endda en enkelt måls placering inden for den samlede prøvepopulation. I en ideel kurve vil 68 procent af værdierne for variablen målt i prøven og formodentlig i populationen ligge inden for et standardafvigelse fra gennemsnittet i begge retninger eller μ-1σ og μ + 1σ. Når man bevæger sig længere langs klokkekurven, vil værdier for 95 procent af prøven og populationen være placeret inden for plus eller minus to standardafvigelser fra gennemsnittet, eller μ-2σ og μ + 2σ. Helt i kanterne af frekvensfordelingskurven falder alle undtagen 0,25 procent inden for plus eller minus tre standardafvigelser. De sjældne målinger, der ligger i 0,25 procent ud over målingerne af tre standardafvigelser, er kendt som outliers og fjernes ofte fra data, når inferentielle beregninger finder sted.