Hva er en klokkekurve?
En klokkekurve er en graf som skildrer en normal fordeling av variabler, der de fleste verdier klynger seg rundt et middel, mens outliers kan bli funnet over og under gjennomsnittet. For eksempel følger menneskelig høyde ofte en klokkekurve, med outliers som er uvanlig korte og høye og hoveddelen av mennesker blir konsentrert rundt en gjennomsnittlig høyde, for eksempel 70 tommer (178 centimeter) for amerikanske menn. Når data som følger et normalt distribusjonsmønster graferes, ligner grafen ofte en bjelle i tverrsnitt, og forklarer begrepet “Bell Curve.”
Normale eller gaussiske distribusjoner kan finnes i en rekke sammenhenger, fra grafer over ytelsen til finansmarkedene til testresultater. Når variabler graferes og det vises en bellekurve, blir dette ofte antatt at variablene var innenfor normale forventninger, og at de oppfører seg på en forutsigbar måte. Hvis grafen er skjev eller uregelmessig, kan det indikere at det er et problem.
Ideelt sett er en klokkekurve symmetrisk. Ved scoring, for eksempel, bør en test skrives på en slik måte at et lite antall studenter mislykkes med en F, og et like lite antall får en perfekt poengsum med et A. Et litt større antall studenter skal få DS og BS, og det største antallet skal få CS. Hvis klokkekurven er skjev og toppen av kurven er i DS, antyder det at testen var for hard, mens en test med en topp i BS er for enkel.
Ved hjelp av en klokkekurve er det også mulig å komme frem til standardavviket for dataene. Standardavviket viser hvor tett pakket variablene er rundt gjennomsnittet. Standardavvik gjenspeiler mangfoldet av variablene som er plottet, og de kan brukes til å samle informasjon om gyldigheten av dataene. Et stort standardavvik indikerer at variablene ikke er tett gruppert, og at det kan være et problem med dataene, mens liten standard devIasjoner antyder at dataene kan være mer gyldige.
For eksempel når avstemningene gjennomføres, frigjør valgfirmaet standardavvik. Hvis standardavviket er lite, betyr det at avstemningen skulle gjentas, ville dataene være veldig nær den fra den opprinnelige avstemningen, noe som antyder at valglokalet brukte gyldige metoder og at informasjonen er nøyaktig. Hvis standardavviket er stort, vil det imidlertid indikere at gjentatte avstemninger kanskje ikke returnerer de samme resultatene, noe som gjør dataene mindre nyttige.