Hvad er en klokkekurve?
En klokkekurve er en graf, der viser en normal fordeling af variabler, hvor de fleste værdier klynger sig omkring et middelværdi, mens outliers kan findes over og under middelværdien. F.eks. Følger menneskets højde ofte en klokkekurve, med outliers, der er usædvanligt korte og høje, og hovedparten af mennesker koncentreres omkring en gennemsnitlig højde, såsom 70 inches (178 centimeter) for amerikanske mænd. Når data, der følger et normalt fordelingsmønster, er tegnet, ligner grafen ofte en klokke i tværsnit, hvilket forklarer udtrykket "klokkekurve."
Normale eller gaussiske distributioner findes i en lang række forskellige sammenhænge, fra grafer over de finansielle markeders resultater til testresultater. Når variabler tegnes og der vises en klokkekurve, antages det ofte at variablerne var inden for normale forventninger, og at de opfører sig på en forudsigelig måde. Hvis grafen er skæv eller uregelmæssig, kan det indikere, at der er et problem.
Ideelt set er en klokkekurve symmetrisk. Ved score for eksempel skal en test skrives på en sådan måde, at et lille antal studerende mislykkes med en F, og et lige så lille antal får en perfekt score med en A. Et lidt større antal studerende skal få Ds og Bs , og det største antal bør få Cs. Hvis klokkekurven er skæv og toppen af kurven er i Ds, antyder det, at testen var for hård, mens en test med en top i Bs er for let.
Ved hjælp af en klokkekurve er det også muligt at nå frem til standardafvigelsen for dataene. Standardafvigelsen viser, hvor tæt pakket variablerne er omkring gennemsnittet. Standardafvigelser afspejler mangfoldigheden af de variabler, der planlægges, og de kan bruges til at indsamle information om gyldigheden af dataene. En stor standardafvigelse indikerer, at variablerne ikke er tæt samlet, og at der kan være et problem med dataene, mens små standardafvigelser antyder, at dataene kan være mere gyldige.
For eksempel frigiver pollingfirmaet standardafvigelser, når der foretages afstemninger. Hvis standardafvigelsen er lille, betyder det, at hvis afstemningen skulle gentages, ville dataene være meget tæt på den oprindelige afstemning, hvilket antyder, at pollingfirmaet anvendte gyldige metoder, og at informationen er nøjagtig. Hvis standardafvigelsen er stor, vil det dog indikere, at gentagne afstemninger muligvis ikke returnerer de samme resultater, hvilket gør dataene mindre nyttige.