Vilka är de olika typerna av histogramtolkning?
Det finns många olika typer av histogramtolkning, bestämt av grafens övergripande form. De två huvudsakliga distinktionerna är symmetriska histogram och asymmetriska histogram. Inom dessa två huvudsakliga distinktioner finns ett antal andra distinktioner, beroende på grafens fördelningar. Att förstå de olika typerna av histogramtolkning kan låta analytiker veta något om data vid första anblicken.
Den normala formen på ett histogram kallas klockformen eller klockkurvan. Det högsta antalet datapunkter ligger nära mitten av diagrammet, med allt lägre mängder av punkter i varje ände, rör sig bort från mitten. När en linje dras, ungefär med topparna på stängerna som referenspunkter, liknar den formen på en klocka. Detta är mönstret som uppstår oftast när man analyserar saker som sker i den naturliga världen.
Två typiska variationer av den symmetriska histogramtolkningen är den icke-normala kortsvansen och den icke-normala långsvansen. I dessa fall tenderar datapunkterna fortfarande till och med till och med på båda sidor, men det är viss skillnad i fördelningen. I en kortfattad histogramtolkning tenderar datapunkterna att samlas runt mitten. I en långhalvig tolkning tenderar datapunkterna att vara mer spridda, men fortfarande mest jämnt fördelade på båda sidor.
En annan variant av det symmetriska histogrammet är symmetriskt med outliers. I det här fallet kan det finnas betydande luckor i datamängden som lämnar luckor i histogrammet. Trots detta förblir histogrammet relativt symmetriskt eftersom utskotten visas på båda sidor. I vissa fall kan utskott kastas ut eftersom de inte är statistiskt signifikanta.
Den andra huvudtypen för tolkningar för histogram är den asymmetriska tolkningen. Liksom den andra huvuddelningen kan asymmetriska histogram ytterligare delas upp i underavdelningar. Asymmetriska histogram är också kända som skev histogram, eftersom datapunkterna föredrar en sida av mitten eller den andra sidan. Outliers kan också förekomma i skev histogram, men påverkar vanligtvis inte formen eller medelvärdena, såvida de inte är extrema outliers.
En sned eller asymmetrisk tolkning av histogram är ofta svårt att verkligen åstadkomma eftersom datapunkterna är starkt gynnade för den ena eller den andra sidan. Ofta kan medelvärden betyda mycket lite i sådana datamängder eftersom de är så sneda. Genomsnittet är kanske inte riktigt mitt i histogrammet, och det tenderar att minska dess statistiska betydelse.