Hva er en frekvensfordelingskurve?
En frekvensfordelingskurve er en type beskrivende statistikk som er avbildet som en graf som demonstrerer hyppigheten av en gitt variabeles forekomst, der x representerer et visst mål på variabelenes forekomst og y representerer antall tilfeller ved hver frekvens. Med veldig store populasjoner sies en frekvensfordelingskurve å ligne det statistiske idealet til en bellekurve og antar egenskapene til en normalfordeling. Klokkekurven - også kjent som en normal kurve - er passende navngitt. Det ligner en avrundet bjelle med symmetriske ender avsmalnende og ut mot en nullfrekvens ved x-aksen. Klokkekurven halveres av det idealiserte identiske gjennomsnittet (μ), median og modus for alle målte data, med halvparten av hver graf på hver side.
Når en prøvefrekvensfordelingskurve antas å ha egenskapene til en ideell klokkekurve, kan aspekter av befolkningen under studien antas å være så godt. I addition, standard statistiske formler kan gi en grad slike forutsetninger kan stole på. Med den ideelle klokkekurven antas en populasjons middel, median og modus å være like. Beregning av standardavviket, σ, gir deretter et mål på befolkningsdatas "spredning." I den ideelle kurven finnes alle unntatt 0,25 prosent av en populasjons totale data innenfor pluss eller minus tre standardavvik fra gjennomsnittet av frekvensfordelingskurven, eller mellom μ-3σ og μ+3σ.
Mens den ideelle klokkekurven skiller seg fra en prøvefrekvensfordelingskurve på flere måter, tillater den en viss antatt forståelse av både utvalgspopulasjonen og til og med en enkelt måles beliggenhet i den samlede prøvepopulasjonen. I en ideell kurve vil 68 prosent av verdiene for variabelen målt i prøven, og antagelig i befolkningen, være innenfor en STandardavvik fra gjennomsnittet i begge retninger, eller μ-1σ og μ+1σ. Når de beveger seg lenger langs klokkekurven, vil verdiene for 95 prosent av prøven og befolkningen være lokalisert innenfor pluss eller minus to standardavvik fra gjennomsnittet, eller μ-2σ og μ+2σ. Helt i kantene av frekvensfordelingskurven faller alle unntatt 0,25 prosent innenfor pluss eller minus tre standardavvik. De sjeldne målingene som ligger på 0,25 prosent utover målene for tre standardavvik er kjent som outliers og fjernes ofte fra data når inferensielle beregninger finner sted.