Wat is een frequentieverdelingscurve?
Een frequentieverdelingscurve is een soort beschrijvende statistieken die worden weergegeven als een grafiek die de frequentie van het optreden van een bepaalde variabele laat zien, waarbij x een maat voor het optreden van de variabele vertegenwoordigt en y het aantal gevallen bij elke frequentie vertegenwoordigt. Bij zeer grote populaties lijkt een frequentieverdelingskromme op het statistische ideaal van een klokkromme te lijken en de eigenschappen van een normale verdeling aan te nemen. De belcurve - ook bekend als een normale curve - wordt toepasselijk genoemd. Het lijkt op een afgeronde bel met symmetrische uiteinden die taps toelopen naar een nulfrequentie op de x-as. De klokcurve wordt in tweeën gedeeld door het geïdealiseerde identieke gemiddelde (μ), de mediaan en de modus van alle gemeten gegevens, met de helft van elke grafiek aan weerszijden.
Wanneer wordt aangenomen dat een steekproeffrequentieverdelingskromme de eigenschappen van een ideale klokkromme bezit, kunnen ook aspecten van de onderzochte populatie worden aangenomen. Bovendien kunnen standaard statistische formules een graad geven waarop op dergelijke veronderstellingen kan worden vertrouwd. Bij de ideale klokcurve wordt ervan uitgegaan dat het gemiddelde, de mediaan en de modus van een populatie gelijk zijn. Berekening van de standaarddeviatie, σ, geeft vervolgens een maat voor de "verspreiding" van de populatiegegevens. In de ideale curve wordt alle behalve 0,25 procent van de totale gegevens van een populatie gevonden binnen plus of minus drie standaarddeviaties van het gemiddelde van de frequentieverdelingscurve, of tussen μ-3σ en μ + 3σ.
Hoewel de ideale belcurve op een aantal manieren verschilt van een steekproeffrequentieverdelingscurve, maakt deze enig verondersteld inzicht in zowel de steekproefpopulatie als zelfs de locatie van een enkele meting binnen de totale steekproefpopulatie. In een ideale curve zal 68 procent van de waarden voor de variabele gemeten in de steekproef, en vermoedelijk in de populatie, binnen één standaardafwijking van het gemiddelde in beide richtingen liggen, of μ-1σ en μ + 1σ. Als we verder gaan langs de belcurve, zullen de waarden voor 95 procent van de steekproef en de populatie worden gelokaliseerd binnen plus of min twee standaarddeviaties van het gemiddelde, of μ-2σ en μ + 2σ. Helemaal aan de randen van de frequentieverdelingscurve valt alles behalve 0,25 procent binnen plus of min drie standaarddeviaties. De zeldzame metingen die liggen in de 0,25 procent boven de metingen van drie standaarddeviaties staan bekend als uitbijters en worden vaak uit gegevens verwijderd wanneer inferentiële berekeningen plaatsvinden.