Vad är histogramklasser?
Histogramklasser är värden som innehåller datapunkter i en frekvensfördelning eller tabulering av rådata. De kallas också intervaller, fack eller pappersbredd. I ett histogram, en typ av stapeldiagram, visas dessa klasser som vertikala kolumner där kolumnens höjd indikerar antalet datapunkter som ingår i klassområdet. Valet av histogramklass görs vanligtvis för att förbättra den visuella representationen av datastatistik eller trender.
När det finns en stor mängd data att visa är ett histogram särskilt användbart för att avbilda formen för dess distribution. Ett helt dataområde delas upp i intervaller och antalet datapunkter som faller in i varje räknas för att ge klassfrekvensen. Intervallet, eller bredden, för intervallet bestämmer antalet histogramklasser och påverkar grafens form.
Om intervallet är för stort kan betydande information utelämnas av att klasserna är för inkluderande. När valet av intervallbredd är för smalt, kan låg klassfrekvens ge onödig vikt för vad som faktiskt är en slumpmässig variation. Det finns flera metoder för att ställa in ett lämpligt antal histogramklasser för en datamängd.
Enligt Sturgis regel bör antalet klasser ligga nära bas 2-loggen för antalet datapunkter plus en. Med Rice-regeln bör antalet klasser som definieras vara två gånger kubroten för antalet datapunkter. Oavsett vilken metod som används för att välja antalet histogramklasser, bör flera olika bredder försökas för att testa histogramformens känslighet för klassstorlek. Rätt antal klasser är det som mest exakt beskriver fördelningen av data.
Med rätt antal histogramklasser för en mängd data bör en meningsfull grafisk framställning resultera som möjliggör tydlig tolkning. Ett histogram ska visa centrum och spridning av data, eventuella skevheter eller datasymmetri och utskott, eller datapunkter som förekommer utanför det förväntade värdet. Läget, eller det vanligaste värdet, bör vara uppenbart liksom grupperingar som kan indikera ett flertal modalitet. Histogramanalys kan också indikera fel i datainsamlingsprocessen.
Långt använt inom ekonomi och samhällsvetenskap blir histogram mer bekanta i de grafiska skärmarna för konsumentelektronik. Digital fotografering är särskilt öppen för deras användning, med många kameror som innehåller ett färghistogram för att indikera vitbalans och exponering. Ett histogram med digital fotografering kan också visa pixlar när histogramklasser plottas mot grå nyanser.