Hva er de forskjellige typene histogramtolkning?
Det er mange forskjellige typer histogramtolkning, bestemt av grafens generelle form. De to viktigste distinksjonene er symmetriske histogrammer og asymmetriske histogrammer. Innenfor disse to hoveddistinksjonene er det en rekke andre distinksjoner, avhengig av grafens distribusjoner. Ved å forstå de forskjellige typene histogramtolkning kan analytikere vite noe om dataene ved første øyekast.
Den normale formen på et histogram er kjent som klokkeformen, eller klokkekurven. Det høyeste antallet datapunkter er lokalisert nær midten av grafen, med stadig lavere mengder poeng i hver ende, og beveger seg bort fra sentrum. Når det tegnes en linje, omtrent ved å bruke toppen av stengene som referansepunkter, ligner den på formen på en bjelle. Dette er mønsteret som oppstår oftest når du analyserer ting som skjer i den naturlige verden.
To typiske varianter av den symmetriske histogramtolkningen er den ikke-normale kortsvans og den ikke-normale langhaleren. I disse tilfellene har datapunktene en tendens til å være mest jevnt på hver side, men det er en viss forskjell i fordelingen. I en kortfattet histogramtolkning har datapunktene en tendens til å samle seg rundt sentrum. I en langhaletolkning har datapunktene en tendens til å være mer spredt, men fortsatt stort sett jevnt fordelt på hver side.
En annen variant av det symmetriske histogrammet er symmetrisk med outliers. I dette tilfellet kan det være betydelige hull i datasettene som etterlater hull i histogrammet. Til tross for det forblir histogrammet relativt symmetrisk fordi utleggerne vises på begge sider. I noen tilfeller kan outliers kastes ut fordi de ikke er statistisk signifikante.
Den andre hovedtypen av tolkninger for histogrammer er den asymmetriske tolkningen. Som den andre hovedinndelingen, kan asymmetriske histogrammer videre deles inn i underavdelinger. Asymmetriske histogrammer er også kjent som skjevt histogrammer, fordi datapunktene favoriserer den ene siden av midten eller den andre siden. Outliers kan også eksistere i skjevt histogram, men påvirker vanligvis ikke formen eller gjennomsnittet, med mindre de er ekstreme outliers.
En skjev eller asymmetrisk histogramtolkning er ofte vanskelig å virkelig oppnå fordi datapunktene er sterkt foretrukket for den ene eller den andre siden. Ofte kan gjennomsnitt bety veldig lite i slike datasett fordi de er så skjevt. Gjennomsnittet er kanskje ikke virkelig midt i histogrammet, og dette har en tendens til å redusere dets statistiske betydning.