Hvad er de forskellige typer af histogramtolkning?
Der er mange forskellige typer af histogramtolkning, bestemt af grafens samlede form. De to vigtigste sondringer er symmetriske histogrammer og asymmetriske histogrammer. Inden for disse to større sondringer er der en række andre sondringer, afhængigt af fordelingen af grafen. At forstå de forskellige typer af histogramtolkning kan lade analytikere vide noget om dataene ved første øjekast.
Den normale form på et histogram kaldes klokkeformen eller klokkekurven. Det højeste antal datapunkter er placeret nær midten af grafen, med stadig mindre mængder af point i hver ende og bevæger sig væk fra centrum. Når der tegnes en linje, groft ved at bruge toppen af bjælkerne som referencepunkter, ligner den formen på en klokke. Dette er det mønster, der ofte forekommer, når man analyserer ting, der forekommer i den naturlige verden.
To typiske variationer af den symmetriske histogramtolkning er den ikke-normale, korte haler og den ikke-normale, lange haler. I disse tilfælde er datapunkterne fortsat for det meste endda på hver side, men der er nogen forskel i fordelingen. I en kortfattet histogramtolkning har datapunkterne en tendens til at samles rundt om midten. I en langhaletolkning har datapunkterne en tendens til at være mere spredte, men stadig stort set jævnt fordelt på hver side.
En anden variation af det symmetriske histogram er symmetrisk med outliers. I dette tilfælde kan der være betydelige huller i datasættene, der efterlader huller i histogrammet. På trods af dette forbliver histogrammet relativt symmetrisk, fordi udskillerne vises på begge sider. I nogle tilfælde kan outliers kastes, fordi de ikke er statistisk signifikante.
Den anden vigtigste type fortolkning for histogrammer er den asymmetriske fortolkning. Som den anden større opdeling kan asymmetriske histogrammer yderligere opdeles i underafdelinger. Asymmetriske histogrammer er også kendt som skæve histogrammer, fordi datapunkterne favoriserer den ene side af midten eller den anden side. Outliers kan også findes i skæve histogrammer, men påvirker normalt ikke formen eller gennemsnittet, medmindre de er ekstreme outliers.
En skæv eller asymmetrisk histogramtolkning er ofte vanskeligt at virkelig opnå, fordi datapunkterne er stærkt begunstiget på den ene eller den anden side. Gennemsnit kan ofte betyde meget lidt i sådanne datasæt, fordi de er så skæve. Gennemsnittet er måske ikke rigtigt midt i histogrammet, og dette har en tendens til at reducere dets statistiske betydning.