Wat is een belcurve?
Een belcurve is een grafiek die een normale verdeling van variabelen weergeeft, waarbij de meeste waarden zich rond een gemiddelde groeperen, terwijl uitbijters boven en onder het gemiddelde kunnen worden gevonden. De menselijke lengte volgt bijvoorbeeld vaak een klokcurve, met uitschieters die ongewoon kort en lang zijn en het grootste deel van de mensen geconcentreerd rond een gemiddelde lengte, zoals 70 inch (178 centimeter) voor Amerikaanse mannen. Wanneer gegevens die een normaal distributiepatroon volgen in een grafiek worden weergegeven, lijkt de grafiek vaak op een bel in dwarsdoorsnede, wat de term "belcurve" verklaart.
Normale of Gaussiaanse distributies zijn te vinden in een breed scala van contexten, van grafieken van de prestaties van financiële markten tot testscores. Wanneer variabelen in een grafiek worden weergegeven en er een klokcurve verschijnt, betekent dit vaak dat de variabelen binnen de normale verwachtingen lagen en dat ze zich op een voorspelbare manier gedroegen. Als de grafiek scheef of onregelmatig is, kan dit erop duiden dat er een probleem is.
In het ideale geval is een belcurve symmetrisch. Bij het scoren moet een toets bijvoorbeeld zo worden geschreven dat een klein aantal studenten faalt met een F en een even klein aantal een perfecte score krijgt met een A. Een iets groter aantal studenten moet D's en Bs krijgen , en het grootste aantal zou Cs moeten krijgen. Als de belcurve scheef staat en de piek van de curve in de Ds is, suggereert dit dat de test te moeilijk was, terwijl een test met een piek in de Bs te gemakkelijk is.
Met behulp van een belcurve is het ook mogelijk om tot de standaarddeviatie voor de gegevens te komen. De standaarddeviatie laat zien hoe strak de variabelen rond het gemiddelde liggen. Standaardafwijkingen weerspiegelen de diversiteit van de variabelen die worden geplot en ze kunnen worden gebruikt om informatie te verzamelen over de geldigheid van de gegevens. Een grote standaardafwijking geeft aan dat de variabelen niet nauw zijn geclusterd en dat er een probleem met de gegevens kan zijn, terwijl kleine standaardafwijkingen suggereren dat de gegevens mogelijk meer geldig zijn.
Wanneer bijvoorbeeld peilingen worden gehouden, geeft het peilbedrijf standaarddeviaties vrij. Als de standaarddeviatie klein is, betekent dit dat als de peiling zou worden herhaald, de gegevens erg dicht bij die van de oorspronkelijke peiling zouden liggen, wat suggereert dat het peilingsbedrijf geldige methoden heeft gebruikt en dat de informatie juist is. Als de standaarddeviatie groot is, zou dit er echter op wijzen dat herhaalde peilingen mogelijk niet dezelfde resultaten opleveren, waardoor de gegevens minder nuttig zijn.