Hvad er histogramklasser?
Histogramklasser er værdier af værdier, der indeholder datapunkter i en frekvensfordeling eller tabulering af rå data. De omtales også som intervaller, bakker eller skraldespand. I et histogram, en type søjlediagram, er disse klasser afbildet som lodrette søjler, hvor højden på kolonnen angiver antallet af datapunkter, der er indeholdt i klasseområdet. Typisk foretages valget af histogramklasse for at forbedre den visuelle repræsentation af datastatistikker eller tendenser.
Når der er en stor mængde data at vise, er et histogram især nyttigt til at skildre formen på dens distribution. En hel række data er opdelt i intervaller, og antallet af datapunkter, der falder ind i hver, tælles for at give klassefrekvensen. Området eller bredden af intervallet bestemmer antallet af histogramklasser og påvirker formen på grafen.
Hvis intervallet er for bredt, kan betydelig information udelades af, at klasserne er for inkluderende. NårValg af intervalbredde er for smal, lav klassefrekvens kan give unødig betydning for det, der faktisk er en tilfældig variation. Der er flere metoder til at indstille et passende antal histogramklasser til et datasæt.
I henhold til Sturgis's regel skal antallet af klasser være tæt på Base 2 -loggen over antallet af datapunkter plus en. Ved hjælp af Rice's regel skal antallet af definerede klasser være dobbelt så meget som terningens rod af antallet af datapunkter. Uanset hvilken metode der bruges til at vælge antallet af histogramklasser, bør flere forskellige bredder forsøges at teste følsomheden af histogramformen for klassestørrelse. Det korrekte antal klasser er det, der mest nøjagtigt skildrer fordelingen af dataene.
Med det rigtige antal histogramklasser for en række data bør en meningsfuld grafisk repræsentation resultere, der muliggør klar fortolkning. En histogrAM skal vise centrum og spredning af dataene, enhver skævhed eller dataasymmetri og outliers eller datapunkter, der forekommer uden for det forventede værdierområde. Tilstanden, eller hyppigst forekommende værdi, skal være synlige såvel som grupperinger, der kan indikere en multiple modalitet. Histogramanalyse kan også indikere fejl i dataindsamlingsprocessen.
Langt brugt i finansiering og samfundsvidenskab bliver histogrammer mere kendte i de grafiske udstillinger af forbrugerelektronik. Digital fotografering er især åben for deres anvendelse, hvor mange kameraer indeholder et farvehistogram for at indikere hvidbalance og eksponering. Et digitalt fotograferingshistogram kan også vise pixels som histogramklasser, der er afbildet mod grå nuancer.