Hva er en bjellekurve?
En klokkekurve er en graf som viser en normal fordeling av variabler, der de fleste verdier klynger seg rundt et middel, mens outliers finner du over og under middelverdien. For eksempel følger ofte menneskets høyde en klokkekurve, med outliers som er uvanlig korte og høye, og hoveddelen av mennesker konsentreres rundt en gjennomsnittlig høyde, for eksempel 178 centimeter (17 inches) for amerikanske menn. Når data som følger et normalt distribusjonsmønster er tegnet, ligner grafen ofte en bjelle i tverrsnitt, noe som forklarer begrepet "klokkekurve."
Normale eller gaussiske distribusjoner finnes i en rekke sammenhenger, fra grafer over resultatene til finansmarkedene til testresultater. Når variabler graferes og en klokkekurve vises, antas dette ofte at variablene var innenfor normale forventninger, og at de oppfører seg på en forutsigbar måte. Hvis grafen er skjev eller uregelmessig, kan det indikere at det er et problem.
Ideelt sett er en bjellekurve symmetrisk. Ved score, for eksempel, skal en test skrives på en slik måte at et lite antall studenter mislykkes med en F, og et like lite antall får en perfekt poengsum med en A. Et litt større antall studenter bør få Ds og Bs , og det største antallet bør få Cs. Hvis klokkekurven er skjev og toppen av kurven er i Ds, antyder det at testen var for hard, mens en test med en topp i Bs er for lett.
Ved hjelp av en bjellekurve er det også mulig å komme frem til standardavviket for dataene. Standardavviket viser hvor tettpakket variablene er rundt gjennomsnittet. Standardavvik gjenspeiler mangfoldet av variablene som er plottet, og de kan brukes til å samle informasjon om gyldigheten av dataene. Et stort standardavvik indikerer at variablene ikke er tett gruppert, og at det kan være et problem med dataene, mens små standardavvik antyder at dataene kan være mer gyldige.
For eksempel når meningsmålinger blir gjennomført, frigir valglederiet standardavvik. Hvis standardavviket er lite, betyr det at hvis avstemningen skulle gjentas, ville dataene ligge veldig nær den for den opprinnelige avstemningen, noe som antyder at valglederiet brukte gyldige metoder og at informasjonen er nøyaktig. Hvis standardavviket er stort, vil det imidlertid indikere at gjentatte avstemninger kanskje ikke gir de samme resultatene, noe som gjør dataene mindre nyttige.