Was ist Histogramm-Plotten?
Das Histogramm-Plotten in der Statistik ist die Verwendung eines Graphen, um die Wahrscheinlichkeitsverteilung darzustellen und Normalwerte dieser Verteilung mit einer gegebenen Variablen zu schätzen. Diese Darstellung erfolgt im Balkendiagrammformat, und die Informationen können normalisiert werden, um Datenerfassungsfehler zu berücksichtigen. Das Histogramm ist normalerweise so aufgebaut, dass die Häufigkeit der Variablen links und der Variablen unten angezeigt wird. Das manuelle Erstellen eines Histogramms ist im Allgemeinen einfach, es sei denn, eine große Datenmenge wird erfasst. In diesem Fall können mathematische Programme und Tabellenkalkulationsprogramme die Daten in ein Histogramm umwandeln. Wenn das Histogramm erstellt wird, können mehrere Balken mit derselben Größe vorhanden sein. In diesem Fall werden die Stangen verbunden.
Jedes Histogramm wird als Balkendiagramm erstellt und dient zur Abschätzung, wie oft eine Variable vorkommt. Während das Histogramm-Plotten immer wieder denselben Diagrammstil verwendet, kann ein Histogramm für viele verschiedene Kategorien verwendet werden, z. B. für die Gebäudehöhe, die Ankunft von Flugzeugen pro Minute oder die Anzahl der verschiedenen Stühle in einem Möbelgeschäft oder Lagerhaus. Neben der Anzeige der Häufigkeit einer Variablen wird ein Histogramm üblicherweise unter Verwendung eines Algorithmus normalisiert. Normalisierung ist, wenn die Daten gemäß dem Algorithmus geändert werden, um potenzielle Fehler beim Sammeln von Informationen zu berücksichtigen, und dies führt dazu, dass das Diagramm realistischer wird.
Neben der Verwendung eines Balkendiagramms organisiert das Histogramm-Plotten das Diagramm auf standardmäßige Weise. Auf der linken Seite des Histogramms, das häufig als Häufigkeit bezeichnet wird, kann der Benutzer überprüfen, wie oft die Variable aufgetreten ist. Im unteren Bereich des Histogramms wird die Variable selbst angezeigt. Wenn es sich bei der Variablen beispielsweise um die Gebäudehöhe handelt, werden im unteren Bereich unterschiedliche Höhenangaben angezeigt, und die Balken werden entsprechend der Anzahl der Gebäude, die während der Datenerfassung gefunden wurden, angehoben.
Das Zeichnen von Histogrammen mit einer kleinen Datenmenge ist einfach und kann manuell durchgeführt werden. Dies wird jedoch schwierig, wenn Hunderte oder Tausende von Datensätzen erfasst werden. Dies führt dazu, dass die meisten Histogramme mit Mathematik- und Tabellenkalkulationssoftware erstellt werden. Diese Programme nehmen die Daten auf und ordnen sie automatisch in einem Histogramm an.
Beim Zeichnen des Histogramms haben die meisten benachbarten Balken nicht die gleiche Höhe, da die Häufigkeit für die Variable unterschiedlich ist. Wenn die Frequenz für mehrere Balken in einer Reihe gleich ist, werden diese Balken normalerweise verbunden und in einen sehr breiten Balken umgewandelt. Dies erleichtert das Anzeigen des Histogramms und das Erstellen, insbesondere wenn der breite Balken einen großen Bereich des Histogramms überspannt.