Hva er en frekvensfordelingskurve?
En frekvensfordelingskurve er en type beskrivende statistikk som er avbildet som en graf som viser frekvensen for en gitt variabns forekomst, der x representerer et visst mål for variabelen forekomst og y representerer antall tilfeller ved hver frekvens. Med veldig store populasjoner sies en frekvensfordelingskurve å ligne det statistiske idealet for en bjellekurve og antar egenskapene til en normalfordeling. Klokkekurven - også kjent som en normal kurve - er passende navngitt. Den ligner en avrundet klokke med symmetriske ender som taper ned og ut mot en nullfrekvens ved x-aksen. Klokkekurven er halvert av det idealiserte identiske gjennomsnittet (μ), median og modus for alle målte data, med halvparten av hver graf på hver side.
Når en prøvefrekvensfordelingskurve antas å ha egenskapene til en ideell klokkekurve, kan også aspekter av populasjonen som studeres antas. I tillegg kan standardstatistiske formler gi en grad som slike forutsetninger kan baseres på. Med den ideelle klokkekurven antas alle befolkningens gjennomsnitt, median og modus å være like. Beregning av standardavviket, σ, gir deretter et mål på populasjonsdataens "spredning". I den ideelle kurven er alle unntatt 0,25 prosent av befolkningens totale data funnet innenfor pluss eller minus tre standardavvik fra gjennomsnittet av frekvensfordelingskurven, eller mellom μ-3σ og μ + 3σ.
Mens den ideelle klokkekurven skiller seg fra en prøvefrekvensfordelingskurve på flere måter, tillater den en viss antatt forståelse av både utvalgspopulasjonen og til og med en enkelt måles beliggenhet innenfor den totale prøvepopulasjonen. I en ideell kurve vil 68 prosent av verdiene for variabelen målt i prøven, og antagelig i populasjonen, ligge innenfor ett standardavvik fra middelverdien i begge retninger, eller μ-1σ og μ + 1σ. Hvis du beveger deg lenger langs klokkekurven, vil verdiene for 95 prosent av prøven og befolkningen være innenfor pluss eller minus to standardavvik fra gjennomsnittet, eller μ-2σ og μ + 2σ. Helt i kantene av frekvensfordelingskurven faller alle unntatt 0,25 prosent innenfor pluss eller minus tre standardavvik. De sjeldne målingene som ligger i 0,25 prosent utover målene for tre standardavvik er kjent som outliers og blir ofte fjernet fra data når inferensielle beregninger finner sted.