Vad är en klockkurva?
En klockkurva är en graf som visar en normal fördelning av variabler, där de flesta värden klusterar runt ett medelvärde, medan outliers kan hittas över och under medelvärdet. Till exempel följer mänsklig höjd ofta en klockkurva, med outliers som är ovanligt korta och höga och huvuddelen av människor är koncentrerade runt en medelhöjd, till exempel 70 tum (178 centimeter) för amerikanska män. När data som följer ett normalt distribueringsmönster grafiseras, liknar diagrammet ofta en klocka i tvärsnitt, vilket förklarar termen "klockkurva."
Normala eller Gaussiska distributioner finns i en mängd olika sammanhang, från diagram över finansmarknadernas prestanda till testresultat. När variabler graferas och en klockkurva visas betraktas detta ofta att variablerna låg inom normala förväntningar och att de uppför sig på ett förutsägbart sätt. Om grafen är sned eller oregelbunden kan det indikera att det finns ett problem.
Helst är en klockkurva symmetrisk. Vid poäng, till exempel, bör ett test skrivas på ett sådant sätt att ett litet antal elever misslyckas med ett F, och ett lika litet antal får en perfekt poäng med ett A. Ett något större antal studenter bör få Ds och Bs , och det största antalet bör få Cs. Om klockkurvan är skev och toppens kurva är i Ds, antyder det att testet var för hårt, medan ett test med en topp i Bs är för lätt.
Med hjälp av en klockkurva är det också möjligt att nå standardavvikelsen för data. Standardavvikelsen visar hur tätt packade variablerna är runt medelvärdet. Standardavvikelser återspeglar mångfalden i de variabler som planeras, och de kan användas för att samla information om giltigheten av uppgifterna. En stor standardavvikelse indikerar att variablerna inte är hårt klusterade och att det kan vara ett problem med data, medan små standardavvikelser antyder att data kan vara mer giltiga.
Till exempel när valfrågor genomförs släpper röstningsföretaget standardavvikelser. Om standardavvikelsen är liten, betyder det att om omröstningen skulle upprepas, skulle uppgifterna ligga mycket nära den från den ursprungliga undersökningen, vilket tyder på att röstningsföretaget använde giltiga metoder och att informationen är korrekt. Om standardavvikelsen är stor, skulle det emellertid indikera att upprepade undersökningar kanske inte ger samma resultat, vilket gör datan mindre användbar.