Vad är normal sannolikhetsfördelning?
Statistikens principer anser att med tanke på en tillräcklig provstorlek är det möjligt att förutsäga den normala sannolikhetsfördelningen för en större befolkning. De flesta människor associerar fördelningssannolikhet med den form som blir resultatet när data graferas, vilket kommer att bilda en klockkurva. Den normala kurvan visar en större koncentration nära medelvärdet eller den punkt där hälften av provet ligger på endera sidan. Det finns färre element i provet när man rör sig bort från medelpunkten.
Det är lätt att föreställa sig klockkurvan som representerar den normala sannolikhetsfördelningen om man föreställer sig vad som händer när mjöl siktas på en tallrik. Det mesta av mjölet landar i en hög direkt under sifteren. När man rör sig bort från toppen av kullen blir mjölet mindre djupt, och vid kanten av plattan kan lite eller inget mjöl hittas.
För att kvantifiera hur provet, såsom mjölet, sprids, är det nödvändigt att förklara standardavvikelser. I enklaste termer indikerar standardavvikelsen hur utbrett varje databas är från andra datapunkter och medelvärdet. Om punkterna är sammanslagna nära kommer standardavvikelsen att vara mindre än om de är spridda i stort. Om exempelvis medeltemperaturen i en stad varierar dramatiskt beroende på säsong kommer den att ha en större standardavvikelse än den normala sannolikhetsfördelningen för en stad på ekvatorn där temperaturen förblir relativt konstant hela året.
Tänk som exempel på att i USA är 27,8 procent av kvinnors skorna i storlek 8 och 8,5, 23,7 procent i storlek 7 och 7,5 och 17,5 procent i storlek 9 eller 9,5. Baserat på denna information har skoproducenter fastställt den genomsnittliga skostorleken som en 8 till 8,5; att använda 27,8 som medelvärde och tilldela en standardavvikelse för en skostorlek bör bevisa att cirka 68 procent av alla kvinnor bär mellan en 7 och en 9,5 sko. Att lägga till siffrorna ger 69 procent, väl inom den normala sannolikhetsfördelningen.
För att flytta utåt från medelvärdet bör siffrorna indikera att cirka 99 procent sliter mellan storlek 5 och storlek 11. Med tanke på tillverkarnas rapporter att 4,8 procent av all försäljning är i storlek 5 eller 5,5 är 11,7 procent storlek 6 eller 6,5, 10 procent är en storlek 10 eller 10,5 och 3 procent är en storlek 11, man kan se att 98,5 procent av all försäljning följer principen om normal sannolikhetsfördelning. Endast 1,5 procent av alla sålda skor faller utöver tre standardavvikelser för medelvärdet.
Principerna för normal sannolikhetsfördelning används för många olika applikationer. Pollsters använder ibland fördelningssannolikhet för att förutsäga riktigheten av de data de samlar in. Den normala kurvan kan också användas i finansiella applikationer, till exempel för att analysera resultatet för en viss aktie. Lärare kan tillämpa lagarna för normal sannolikhetsfördelning för att förutsäga framtida testresultat eller för att betygsätta papper på en kurva.