Hva er histogramklasser?
Histogramklasser er verdiområder som inneholder datapunkter i en frekvensfordeling, eller tabulering av rå data. De blir også referert til som intervaller, binger eller søppelbredde. I et histogram, en type søylediagram, er disse klassene avbildet som vertikale kolonner der høyden på kolonnen indikerer antall datapunkter som er inneholdt i klasseområdet. Valget av histogramklasse er vanligvis gjort for å forbedre den visuelle representasjonen av datastatistikk eller trender.
Når det er en stor mengde data som skal vises, er et histogram spesielt nyttig for å skildre formen for distribusjonen. Et helt spekter av data blir delt opp i intervaller, og antall datapunkter som faller inn i hver blir talt for å gi klassefrekvensen. Området, eller bredden, av intervallet bestemmer antall histogramklasser og påvirker formen til grafen.
Hvis intervallet er for bredt, kan betydelig informasjon utelates ved at klassene er for inkluderende. Når valget av intervallbredde er for smalt, kan lav klassefrekvens gi unødig betydning for hva som faktisk er en tilfeldig variasjon. Det er flere metoder for å angi et passende antall histogramklasser for et datasett.
I følge Sturgis regel skal antall klasser ligge nær base 2-loggen for antall datapunkter, pluss en. Ved å bruke Rice's regel, skal antallet klasser som er definert være dobbelt kubusroten for antall datapunkter. Uansett hvilken metode som brukes for å velge antall histogramklasser, bør flere forskjellige bredder prøves for å teste følsomheten til histogramformen for klassestørrelse. Riktig antall klasser er det som mest nøyaktig viser distribusjonen av dataene.
Med riktig antall histogramklasser for en rekke data, bør det gi en meningsfull grafisk fremstilling som muliggjør klar tolkning. Et histogram skal vise sentrum og spredning av dataene, eventuelle skjevheter eller datasymmetri, og outliers, eller datapunkter som forekommer utenfor det forventede verdiområdet. Modusen, eller hyppigst forekommende verdi, bør være åpenbar, så vel som grupperinger som kan indikere flere modaliteter. Histogramanalyse kan også indikere feil i datainnsamlingsprosessen.
Lenge brukt i finans og samfunnsvitenskap, blir histogrammer mer kjent i de grafiske visningene av forbrukerelektronikk. Digital fotografering er spesielt åpen for bruk, med mange kameraer som inneholder et fargeshistogram for å indikere hvitbalanse og eksponering. Et histogram med digital fotografering kan også vise piksler når histogramklasser plottet mot gråtoner.