Jakie są różne typy interpretacji histogramu?
Istnieje wiele różnych rodzajów interpretacji histogramów, określonych przez ogólny kształt wykresu. Dwa główne rozróżnienia to histogramy symetryczne i histogramy asymetryczne. W obrębie tych dwóch głównych różnic wyróżnia się szereg innych różnic, w zależności od rozkładów wykresu. Zrozumienie różnych rodzajów interpretacji histogramu może pozwolić analitykom na pierwszy rzut oka dowiedzieć się czegoś o danych.
Normalny kształt histogramu jest znany jako kształt dzwonu lub krzywa dzwonu. Największa liczba punktów danych znajduje się w pobliżu środka wykresu, z coraz mniejszą liczbą punktów na każdym końcu, oddalając się od środka. Kiedy linia jest rysowana, z grubsza wykorzystując wierzchołki prętów jako punkty odniesienia, przypomina kształt dzwonu. Jest to wzorzec, który występuje najczęściej podczas analizy rzeczy występujących w świecie przyrody.
Dwie typowe odmiany symetrycznej interpretacji histogramu to nienormalne krótkie ogony i nienormalne długie ogony. W takich przypadkach punkty danych zwykle są w większości nawet po obu stronach, ale istnieje pewna różnica w rozkładzie. W interpretacji histogramu z krótkim ogonem punkty danych mają tendencję do skupiania się wokół środka. W długookresowej interpretacji punkty danych są bardziej rozłożone, ale nadal w większości równomiernie rozmieszczone po obu stronach.
Inna odmiana symetrycznego histogramu jest symetryczna z wartościami odstającymi. W takim przypadku mogą występować znaczące luki w zestawach danych, które pozostawiają luki w histogramie. Mimo to histogram pozostaje stosunkowo symetryczny, ponieważ wartości odstające pojawiają się po obu stronach. W niektórych przypadkach wartości odstające mogą zostać wyrzucone, ponieważ nie są istotne statystycznie.
Innym ważnym rodzajem interpretacji histogramów jest interpretacja asymetryczna. Podobnie jak inne główne podziały, asymetryczne histogramy można dalej podzielić na poddziały. Histogramy asymetryczne są również znane jako histogramy skośne, ponieważ punkty danych faworyzują jedną stronę środka lub drugą stronę. Wartości odstające mogą również występować w wypaczonych histogramach, ale zwykle nie wpływają na kształt ani średnie wartości, chyba że są skrajnymi wartościami odstającymi.
Przekrzywiona lub asymetryczna interpretacja histogramu jest często trudna do osiągnięcia, ponieważ punkty danych są zdecydowanie uprzywilejowane po jednej lub drugiej stronie. Często średnie w takich zestawach danych mogą niewiele znaczyć, ponieważ są one tak wypaczone. Średnia może nie znajdować się dokładnie w środku histogramu, co zwykle zmniejsza jej znaczenie statystyczne.