Co to jest histogram?
W statystykach histogram to rodzaj wykresu pokazującego rozkład częstotliwości danych, zwykle w postaci pionowych pasków. Ten typ wykresu jest również powszechnie nazywany histogramem częstotliwości, a czasem wykresem słupkowym lub słupkowym. Na wykresie histogramu wysokość każdego słupka pokazuje liczbę elementów, które mieszczą się w tym zakresie na wykresie. Wykresy rozkładu histogramu są często uważane za najważniejsze narzędzie do badania rozkładu danych.
Wykres histogramu jest zazwyczaj przedstawiany z częstotliwością wartości danych na pionowej osi Y wykresu oraz z różnymi typami lub kategoriami danych wzdłuż poziomej osi X wykresu. Oprócz pokazania, jak często określona wartość występuje w zbiorze danych, niektóre inne informacje można uzyskać za pomocą analizy statystycznej danych histogramu. Obejmuje to „kształt” danych, taki jak rozkład „płaski” lub rozkład „w kształcie dzwonu”.
Wykres Pareto to specjalny rodzaj histogramu, w którym paski są uporządkowane według wielkości, przy czym najwyższy pasek jest pokazany po lewej stronie wykresu, a najmniejszy po prawej. Te wykresy Pareto są często używane w projektach kontroli jakości w celu podkreślenia najczęstszych wad produktu w systemach produkcyjnych. Nazwa pochodzi od „zasady Pareto”, zgodnie z którą 20% nakładów na proces produkcyjny spowoduje 80% wad.
Niektóre przykłady wzorców, które można wykryć na histogramach, obejmują wzorce pojedynczego piku i podwójnego piku. Pojedynczy pik w danych jest również średnią statystyczną danych. Gdy średnia statystyczna nie znajduje się w środku wykresu, może to wskazywać na szczególny powód, który może być przydatny do zbadania.
Wzorzec podwójnego piku występuje, gdy na wykresie znajdują się dwa bardzo wysokie słupki. Widzenie tego wzorca może wskazywać, że istnieją dwa różne źródła danych. Na przykład na linii produkcyjnej wartości szczytowe można przypisać dwóm indywidualnym operatorom.
Wyrównanie histogramu to metoda stosowana w manipulacji obrazami, na przykład w oprogramowaniu do fotografii cyfrowej. Korzysta z histogramów, aby ustalić, które poziomy intensywności na obrazie są najczęstsze, a następnie rozkłada je bardziej efektywnie. W ten sposób można poprawić ogólny kontrast obrazu w celu lepszego oglądania.