Wat is een normale waarschijnlijkheidsverdeling?
De statistische principes houden in dat, bij voldoende steekproefomvang, de normale kansverdeling van een grotere populatie kan worden voorspeld. De meeste mensen associëren distributiekans met de vorm die ontstaat wanneer de gegevens in een grafiek worden weergegeven, wat een belcurve zal vormen. De normale curve toont een grotere concentratie nabij het gemiddelde, of het punt waarop de helft van het monster aan weerszijden ligt. Er zijn minder elementen van de steekproef als men zich van het gemiddelde punt verwijdert.
Het is gemakkelijk om de klokcurve voor te stellen die de normale waarschijnlijkheidsverdeling weergeeft als men zich voorstelt wat er gebeurt wanneer bloem op een bord wordt gezift. Het merendeel van de bloem landt op een hoop direct onder het zeefje. Wanneer de bloem weggaat van de top van de heuvel, wordt de bloem minder diep en aan de rand van de plaat kan er weinig of geen bloem worden gevonden.
Om de manier te kwantificeren waarop het monster, zoals het meel, wordt verspreid, moeten standaardafwijkingen worden verklaard. In eenvoudige bewoordingen geeft de standaarddeviatie aan hoe ver elk stuk gegevens verspreid is over andere gegevenspunten en het gemiddelde. Als de punten dicht bij elkaar zijn gegroepeerd, is de standaardafwijking kleiner dan wanneer ze wijd verspreid zijn. Als de gemiddelde temperatuur in een stad bijvoorbeeld sterk varieert per seizoen, heeft deze een grotere standaarddeviatie dan de normale waarschijnlijkheidsverdeling van een stad op de evenaar, waar de temperatuur het hele jaar door relatief constant blijft.
Bedenk bijvoorbeeld dat in de VS 27,8 procent van de verkochte damesschoenen in maat 8 en 8,5 is, 23,7 procent in maat 7 en 7,5 en 17,5 procent in maat 9 of 9,5. Op basis van deze informatie hebben schoenfabrikanten de gemiddelde schoenmaat vastgesteld op een 8 tot 8,5; 27,8 als gemiddelde gebruiken en een standaardafwijking van één schoenmaat toekennen, zou moeten bewijzen dat ongeveer 68 procent van alle vrouwen tussen een 7 en een 9,5 schoen draagt. Het optellen van de cijfers levert 69 procent op, ruim binnen de normale kansverdeling.
Uitgaande van het gemiddelde, moeten de cijfers aangeven dat ongeveer 99 procent tussen een maat 5 en een maat 11 slijt. Gezien de rapporten van fabrikanten dat 4,8 procent van alle verkopen een maat 5 of 5,5 zijn, heeft 11,7 procent een maat 6 of 6.5, 10 procent is een maat 10 of 10,5 en 3 procent is een maat 11, je kunt zien dat 98,5 procent van alle verkopen het principe van normale kansverdeling volgt. Slechts 1,5 procent van alle verkochte schoenen valt meer dan drie standaarddeviaties van het gemiddelde.
De principes van normale kansverdeling worden voor veel verschillende toepassingen gebruikt. Pollsters gebruiken soms distributiekans om de nauwkeurigheid van de verzamelde gegevens te voorspellen. De normale curve kan ook worden gebruikt in financiële toepassingen, zoals om de prestaties van een bepaalde voorraad te analyseren. Opvoeders kunnen de wetten van de normale kansverdeling toepassen om toekomstige testscores te voorspellen of om papieren op een curve te beoordelen.