Hva er normal sannsynlighetsfordeling?
Prinsippene for statistikk holder fast at, gitt en tilstrekkelig utvalgstørrelse, er det mulig å forutsi normal sannsynlighetsfordeling for en større befolkning. De fleste forbinder fordelingssannsynlighet med formen som blir resultatet når dataene graferes, noe som vil danne en bjellekurve. Normalkurven vil vise en større konsentrasjon nær gjennomsnittet, eller det punktet hvor halvparten av prøven ligger på hver side. Det er færre elementer i prøven når man beveger seg bort fra middelpunktet.
Det er lett å avbilde klokkekurven som representerer den normale sannsynlighetsfordelingen hvis man forestiller seg hva som skjer når mel siktes på en tallerken. Det meste av melet lander i en haug rett under sifteren. Når du beveger seg bort fra toppen av haugen, blir melet mindre dypt, og ved kanten av tallerkenen finner du lite eller ingen mel.
For å kvantifisere måten prøven, som melet, er spredt på, er det nødvendig å forklare standardavvik. I enkleste termer indikerer standardavviket hvor vidt spredt hvert stykke data er fra andre datapunkter og middelverdien. Hvis punktene er gruppert tett sammen, vil standardavviket være mindre enn hvis de er vidt spredt. Hvis for eksempel gjennomsnittstemperaturen i en by varierer dramatisk etter årstid, vil den ha et større standardavvik enn den normale sannsynlighetsfordelingen for en by på ekvator der temperaturen holder seg relativt konstant hele året.
Som et eksempel, vurder at i USA er 27,8 prosent av kvinneskoene som er solgt i størrelsene 8 og 8,5, 23,7 prosent i størrelsene 7 og 7,5 og 17,5 prosent i størrelsen 9 eller 9,5. Basert på denne informasjonen har skoprodusenter etablert den gjennomsnittlige skostørrelsen som en 8 til 8,5; Å bruke 27,8 som gjennomsnitt og tilordne et standardavvik på en skostørrelse skulle bevise at omtrent 68 prosent av alle kvinner har mellom en 7 og en 9,5 sko. Å legge til tallene gir 69 prosent, godt innenfor normal sannsynlighetsfordeling.
Når man beveger seg utover fra gjennomsnittet, skulle tallene indikere at omtrent 99 prosent har slitasje mellom størrelse 5 og størrelse 11. Gitt produsentens rapporter at 4,8 prosent av alt salg er i størrelse 5 eller 5,5, 11,7 prosent er i størrelse 6 eller 6,5, 10 prosent er en størrelse 10 eller 10,5 og 3 prosent er en størrelse 11, kan man se at 98,5 prosent av alt salg følger prinsippet om normal sannsynlighetsfordeling. Bare 1,5 prosent av alle solgte sko faller ut over tre standardavvik av gjennomsnittet.
Prinsippene for normal sannsynlighetsfordeling brukes til mange forskjellige applikasjoner. Forurensere bruker noen ganger distribusjonssannsynlighet for å forutsi nøyaktigheten av dataene de samler inn. Den normale kurven kan også brukes i økonomiske applikasjoner, for eksempel for å analysere ytelsen til en bestemt aksje. Lærere kan bruke lovene for normal sannsynlighetsfordeling for å forutsi fremtidig testresultat eller for å gi karakterer på en kurve.