Was sind Histogrammklassen?
Histogrammklassen sind Wertebereiche, die Datenpunkte in einer Häufigkeitsverteilung oder eine Tabelle mit Rohdaten enthalten. Sie werden auch als Intervalle, Behälter oder Behälterbreiten bezeichnet. In einem Histogramm, einer Art Balkendiagramm, werden diese Klassen als vertikale Spalten dargestellt, wobei die Höhe der Spalte die Anzahl der im Klassenbereich enthaltenen Datenpunkte angibt. In der Regel wird die Auswahl der Histogrammklasse getroffen, um die visuelle Darstellung von Datenstatistiken oder Trends zu verbessern.
Wenn eine große Datenmenge angezeigt werden soll, ist ein Histogramm besonders nützlich, um die Form seiner Verteilung darzustellen. Ein ganzer Datenbereich wird in Intervalle zerlegt und die Anzahl der Datenpunkte, die in jeden fallen, wird gezählt, um die Klassenfrequenz zu ergeben. Der Bereich oder die Breite des Intervalls bestimmt die Anzahl der Histogrammklassen und beeinflusst die Form des Diagramms.
Wenn das Intervall zu groß ist, werden möglicherweise wichtige Informationen weggelassen, da die Klassen zu umfassend sind. Wenn die Wahl der Intervallbreite zu eng ist, kann eine niedrige Klassenfrequenz einer tatsächlich zufälligen Variation eine übermäßige Bedeutung verleihen. Es gibt verschiedene Methoden zum Festlegen einer geeigneten Anzahl von Histogrammklassen für einen Datensatz.
Nach der Regel von Sturgis sollte die Anzahl der Klassen in der Nähe des Basisprotokolls 2 der Anzahl der Datenpunkte plus 1 liegen. Nach der Regel von Rice sollte die Anzahl der definierten Klassen das Doppelte der Kubikwurzel der Anzahl der Datenpunkte betragen. Unabhängig von der Methode zur Auswahl der Anzahl der Histogrammklassen sollten verschiedene Breiten verwendet werden, um die Empfindlichkeit der Histogrammform gegenüber der Klassengröße zu testen. Die richtige Anzahl von Klassen gibt die Verteilung der Daten am genauesten wieder.
Mit der richtigen Anzahl von Histogrammklassen für einen Datenbereich sollte sich eine aussagekräftige grafische Darstellung ergeben, die eine klare Interpretation ermöglicht. Ein Histogramm sollte den Mittelpunkt und die Streuung der Daten, etwaige Abweichungen oder Datenasymmetrien sowie Ausreißer oder Datenpunkte anzeigen, die außerhalb des erwarteten Wertebereichs liegen. Der Modus oder der am häufigsten vorkommende Wert sollte ebenso offensichtlich sein wie Gruppierungen, die möglicherweise auf eine Mehrfachmodalität hinweisen. Die Histogrammanalyse kann auch auf Fehler im Datenerfassungsprozess hinweisen.
Histogramme, die seit langem in den Finanz- und Sozialwissenschaften verwendet werden, werden in der grafischen Darstellung von Unterhaltungselektronik immer bekannter. Die digitale Fotografie ist für ihre Verwendung besonders offen, da viele Kameras ein Farbhistogramm enthalten, das den Weißabgleich und die Belichtung anzeigt. Ein Digitalfotografie-Histogramm kann auch Pixel als Histogrammklassen anzeigen, die gegen Graustufen aufgetragen sind.