Hva er et histogram?
I statistikk er et histogram en type graf som viser fordelingen av frekvenser av data, vanligvis i form av vertikale søyler. Denne typen graf kalles også ofte et frekvenshistogram, og noen ganger et søylediagram eller søylediagram. I en histogramgraf viser høyden på hver stolpe antall elementer som faller innenfor det området på grafen. Histogramdistribusjonsgrafer blir ofte sett på som det viktigste verktøyet for å studere distribusjonen av data.
Histogramplottet er generelt vist med frekvensen av dataverdiene på grafens vertikale Y-akse og de forskjellige typene eller datakategoriene langs den horisontale X-aksen til grafen. I tillegg til å vise hvor ofte en bestemt verdi forekommer i et sett med data, kan noe annen informasjon hentes ved bruk av statistisk analyse av histogramdata. Dette inkluderer "formen" på dataene, for eksempel en "flat" fordeling eller en "bjelleformet" fordeling.
En Pareto-graf er en spesiell type histogram der stolpene er sortert etter størrelse, med den høyeste linjen vist til venstre på grafen og den minste til høyre. Disse Pareto-grafene brukes ofte i kvalitetskontrollprosjekter for å fremheve de vanligste produktdefektene i produksjonssystemer. De får navnet sitt fra Pareto-prinsippet, som sier at 20% av inngangene til produksjonsprosessen vil forårsake 80% av manglene.
Noen eksempler på mønstre som kan oppdages i histogrammer inkluderer mønster med enkel topp og dobbelt topp. En enkelt topp i dataene er også det statistiske middelgjennomsnittet for dataene. Når det statistiske gjennomsnittet ikke er i midten av grafen, kan dette indikere en spesiell grunn, som kan være nyttig å undersøke.
Et dobbelt toppmønster forekommer der det er to veldig høye søyler på grafen. Når dette mønsteret sees, kan det indikere at det er to distinkte datakilder. For eksempel i en produksjonslinje kan toppene tilskrives to individuelle operatører.
Histogramutjevning er en metode som brukes i bildemanipulering, for eksempel programvare for digital fotografering. Den bruker histogrammer for å finne ut hvilke intensitetsnivåer i bildet som er vanligst, og fordeler disse mer effektivt. På denne måten kan den generelle kontrasten til bildet forbedres for bedre visning.