Hva er histogramplotting?
Histogramstegning i statistikk er bruken av en graf for å vise sannsynlighetsfordeling og for å estimere normale verdier for den distribusjonen med en gitt variabel. Denne plottingen er utført i søylediagramformat, og informasjonen kan normaliseres for å ta hensyn til datainnsamlingsfeil. Histogrammet er normalt organisert for å vise frekvensen til variabelen til venstre og variabelen på bunnen. Det er generelt enkelt å lage et histogram manuelt, med mindre en stor mengde data blir fanget; i dette tilfellet kan matematiske og regnearksprogrammer gjøre dataene til et histogram. Når histogrammet er laget, kan det være flere søyler som har samme størrelse; hvis dette skjer, er stengene koblet til.
Hvert histogram opprettes som et søylediagram og er laget for å estimere hvor mange ganger en variabel vil oppstå. Mens histogramplotting vil bruke samme grafstil om og om igjen, kan et histogram brukes til mange forskjellige kategorier, for eksempel byggehøyde, flyankomster per minutt eller antall forskjellige stoler i en møbelbutikk eller lager. Sammen med å vise frekvensen til en variabel blir et histogram ofte normalisert ved hjelp av en algoritme. Normalisering er når dataene endres, i henhold til algoritmen, for å gjøre rede for potensielle feil under innsamling av informasjon, og det har en tendens til å gjøre grafen mer realistisk.
Sammen med bruk av et søylediagram, organiserer histogramplottingen grafen på en standard måte. På venstre side av histogrammet, ofte merket som frekvens, kan brukeren sjekke antall ganger variabelen skjedde. Den nederste delen av histogrammet viser selve variabelen. For eksempel, hvis variabelen er byggehøyde, vil den nederste delen vise forskjellige høydetall, og stolpene vil stige ut basert på hvor mange bygninger som ble funnet under datainnsamling.
Å utføre histogramplotting med en liten mengde data er enkelt og kan gjøres manuelt; dette blir imidlertid vanskelig når hundrevis eller tusenvis av poster blir fanget. Dette resulterer i at de fleste histogrammer blir laget av matematikk- og regnearkprogramvare. Disse programmene tar dataene og ordner dem automatisk i et histogram.
Når histogramplotting utføres, vil de fleste tilstøtende søyler ikke være i samme høyde, fordi frekvensen vil være forskjellig for variabelen. Hvis frekvensen er den samme for flere stolper på rad, er disse stolpene vanligvis koblet sammen og omgjort til en veldig bred stolpe. Dette gjør det lettere å se på histogrammet og lettere å lage, spesielt hvis den brede linjen spenner over et stort område av histogrammet.