Jakie są klasy histogramu?

Klasy histogramów to zakresy wartości, które zawierają punkty danych w rozkładzie częstotliwości lub tabelaryczne dane surowe. Są one również określane jako interwały, pojemniki lub szerokości pojemników. Na histogramie, typie wykresu słupkowego, klasy te są przedstawione jako pionowe kolumny, w których wysokość kolumny wskazuje liczbę punktów danych zawartych w zakresie klas. Zazwyczaj wybiera się klasę histogramu, aby poprawić wizualną reprezentację statystyk danych lub trendów.

Gdy do wyświetlenia jest duża ilość danych, histogram jest szczególnie przydatny do zobrazowania kształtu jego rozkładu. Cały zakres danych jest podzielony na przedziały, a liczba punktów danych przypadających na każdy jest zliczana w celu uzyskania częstotliwości klasy. Zakres lub szerokość przedziału określa liczbę klas histogramów i wpływa na kształt wykresu.

Jeśli interwał jest zbyt szeroki, znaczące informacje mogą zostać pominięte, ponieważ klasy są zbyt inkluzywne. Gdy wybór szerokości przedziału jest zbyt wąski, niska częstotliwość klasy może nadać nadmierne znaczenie temu, co w rzeczywistości jest przypadkową zmianą. Istnieje kilka metod ustawiania odpowiedniej liczby klas histogramów dla zestawu danych.

Zgodnie z regułą Sturgisa liczba klas powinna być zbliżona do logarytmu podstawowego 2 liczby punktów danych plus jeden. Zgodnie z regułą Rice'a liczba zdefiniowanych klas powinna być dwukrotnością pierwiastka z liczby punktów danych. Niezależnie od tego, która metoda zostanie zastosowana przy wyborze liczby klas histogramów, należy wypróbować kilka różnych szerokości, aby przetestować czułość kształtu histogramu na wielkość klasy. Prawidłowa liczba klas to ta, która najdokładniej przedstawia rozkład danych.

Przy odpowiedniej liczbie klas histogramów dla zakresu danych powinna powstać znacząca reprezentacja graficzna, która umożliwia czytelną interpretację. Histogram powinien pokazywać środek i rozproszenie danych, jakąkolwiek skośność lub asymetrię danych oraz wartości odstające lub punkty danych występujące poza oczekiwanym zakresem wartości. Tryb lub najczęściej występująca wartość powinna być widoczna, podobnie jak grupy, które mogą wskazywać na wiele modalności. Analiza histogramu może również wskazywać na błędy w procesie gromadzenia danych.

Histogramy, od dawna stosowane w finansach i naukach społecznych, stają się coraz bardziej znane na ekranach elektroniki użytkowej. Fotografia cyfrowa jest szczególnie otwarta na ich zastosowanie, ponieważ wiele aparatów ma kolorowy histogram wskazujący balans bieli i ekspozycję. Histogram fotografii cyfrowej może również pokazywać piksele jako klasy histogramu narysowane względem odcieni szarości.

INNE JĘZYKI

Czy ten artykuł był pomocny? Dzięki za opinie Dzięki za opinie

Jak możemy pomóc? Jak możemy pomóc?