Hvad er normal sandsynlighedsfordeling?
Statistikprincipperne hævder, at det med en tilstrækkelig prøvestørrelse er muligt at forudsige den normale sandsynlighedsfordeling for en større befolkning. De fleste mennesker forbinder fordelingssandsynlighed med den form, der opstår, når dataene er graferet, hvilket vil danne en klokkekurve. Den normale kurve viser en større koncentration nær gennemsnittet eller det punkt, hvor halvdelen af prøven ligger på hver side. Der er færre elementer i prøven, når man bevæger sig væk fra middelpunktet.
Det er let at forestille sig klokkekurven, der repræsenterer den normale sandsynlighedsfordeling, hvis man forestiller sig, hvad der sker, når mel sigtes på en plade. Det meste af melet lander i en bunke direkte under sifteren. Når man bevæger sig væk fra toppen af haugen, bliver melet mindre dybt, og ved kanten af pladen findes lidt eller intet mel.
For at kvantificere den måde, hvorpå prøven, såsom melet, spredes, er det nødvendigt at forklare standardafvigelser. På enkleste måde angiver standardafvigelsen, hvor vidt spredt hvert stykke data er fra andre datapunkter og middelværdien. Hvis punkterne er samlet tæt sammen, vil standardafvigelsen være mindre, end hvis de er vidt spredt. For eksempel, hvis den gennemsnitlige temperatur i en by varierer dramatisk efter sæson, vil den have en større standardafvigelse end den normale sandsynlighedsfordeling for en by på ækvator, hvor temperaturen forbliver relativt konstant hele året.
Overvej som et eksempel, at i USA er 27,8 procent af de solgte kvinders sko i størrelse 8 og 8,5, 23,7 procent er i størrelse 7 og 7,5 og 17,5 procent er i størrelse 9 eller 9,5. Baseret på disse oplysninger har skoproducenter fastlagt den gennemsnitlige skostørrelse som en 8 til 8,5; anvendelse af 27,8 som middelværdi og tildeling af en standardafvigelse for en skostørrelse skulle bevise, at ca. 68 procent af alle kvinder bærer mellem en sko og en 9,5 sko. Tilføjelse af tallene giver 69 procent, godt inden for den normale sandsynlighedsfordeling.
Når man bevæger sig udad fra gennemsnittet, skal tallene indikere, at ca. 99 procent er i slid mellem en størrelse 5 og en størrelse 11. I betragtning af producenternes rapporter om, at 4,8 procent af alt salg er i størrelse 5 eller 5,5, er 11,7 procent i størrelse 6 eller 6,5, 10 procent er en størrelse 10 eller 10,5 og 3 procent er en størrelse 11, man kan se, at 98,5 procent af alt salg følger princippet om normal sandsynlighedsfordeling. Kun 1,5 procent af alle solgte sko falder ud over tre standardafvigelser for gennemsnittet.
Principperne for normal sandsynlighedsfordeling anvendes til mange forskellige applikationer. Pollsters bruger undertiden distributionssandsynlighed for at forudsige nøjagtigheden af de data, de indsamler. Den normale kurve kan også bruges i finansielle applikationer, f.eks. Til at analysere ydeevnen for en bestemt bestand. Lærere kan anvende lovene om normal sandsynlighedsfordeling for at forudsige fremtidige testresultater eller for at bedømme papirer på en kurve.