Hvad er de forskellige typer histogramtolkning?
Der er mange forskellige typer histogramtolkning, bestemt af den samlede form af grafen. De to vigtigste sondringer er symmetriske histogrammer og asymmetriske histogrammer. Inden for disse to store sondringer er en række andre sondringer, afhængigt af fordelingen af grafen. At forstå de forskellige typer histogramtolkning kan lade analytikere vide noget om dataene ved første øjekast.
Den normale form af et histogram er kendt som klokkeformen eller klokkekurven. Det højeste antal datapunkter er placeret nær midten af grafen, med stadig lavere mængder af punkter i hver ende og bevæger sig væk fra midten. Når en linje tegnes, groft ved hjælp af toppen af stængerne som referencepunkter, ligner den formen på en klokke. Dette er det mønster, der forekommer oftest, når man analyserer ting, der forekommer i den naturlige verden.
To typiske variationer af den symmetriske histogramtolkning er den ikke-normale korte halede ogden ikke-normale lang halede. I disse tilfælde er datapunkterne stadig for det meste på begge sider, men der er en vis forskel i distributionen. I en korthalet histogramtolkning har datapunkterne en tendens til at slå sig rundt i midten. I en langhalet fortolkning har datapunkterne en tendens til at være mere spredt, men stadig mest jævnt fordelt på hver side.
En anden variation af det symmetriske histogram er symmetrisk med outliers. I dette tilfælde kan der være betydelige huller inden for datasættene, der efterlader huller i histogrammet. På trods af dette forbliver histogrammet relativt symmetrisk, fordi outliers vises på begge sider. I nogle tilfælde kan outliers blive kastet ud, fordi de ikke er statistisk signifikante.
Den anden vigtige type fortolkning for histogrammer er den asymmetriske fortolkning. Som den anden store opdeling kan asymmetriske histogrammer fremer opdelt i underafdelinger. Asymmetriske histogrammer er også kendt som skæve histogrammer, fordi datapunkterne favoriserer den ene side af midten eller den anden side. Outliers kan også eksistere i skæve histogrammer, men påvirker normalt ikke formen eller gennemsnittet, medmindre de er ekstreme outliers.
En skæv eller asymmetrisk histogramtolkning er ofte vanskelig at virkelig opnå, fordi datapunkterne er stærkt foretrukket for den ene eller den anden side. Ofte kan gennemsnit betyde meget lidt i sådanne datasæt, fordi de er så skæve. Gennemsnittet er muligvis ikke virkelig midt i histogrammet, og dette har en tendens til at reducere dens statistiske betydning.