Was ist ein Boxplot?
Ein Box-Plot oder ein Box-and-Whisker-Diagramm ist eine Methode zum Organisieren numerischer Daten entlang einer einzelnen Zahlenlinie, die entweder horizontal oder vertikal sein kann. Wenn der Plot horizontal ist, befindet sich das tatsächliche Feld etwas oberhalb der Zahlenlinie und besteht aus drei vertikalen Linien, die durch horizontale Linien miteinander verbunden sind. Die horizontalen Grenzen der Box stellen das erste und dritte Quartil (25. und 75. Perzentil) dar, die durch die Mittellinie getrennt sind, die den Median oder das 50. Perzentil der Daten darstellt. Auf beiden Seiten des Boxplots erstrecken sich von der Mitte der horizontalen Linien vertikale Linien, die manchmal als Whisker bezeichnet werden. Wenn diese die minimale und maximale Anzahl des Datensatzes erreichen, enden sie in kleineren horizontalen Linien, obwohl dies abhängig von der Datenverteilung geringfügig variieren kann.
Es gibt einige wichtige Elemente, die einen guten Box-Plot ausmachen, und einige Zahlen, die die Benutzer kennen müssen, wenn sie diese Diagramme erstellen. Die erste davon wird die Fünf-Nummern-Zusammenfassung genannt, die oft als Fünf-Nummern-Zusammenfassung abgekürzt wird. Summe. Dies ist eine Auflistung des ersten und dritten Quartils, des Medians sowie der minimalen und maximalen Anzahl der Daten. In einigen Anwendungen müssen diese in der Nähe des Diagramms aufgelistet werden. Die Analyse eines Diagramms mit einer guten Zahlenlinie kann diese Zahlen jedoch auch durch Betrachten der drei horizontalen Linien und der End-Whisker ableiten. Es ist keine Henne / Ei-Frage für die Person, die eine Handlung zeichnet, weil die fünf num. Summe. muss verwendet werden, um den Plot zu erstellen.
Die Leute müssen auch eine Zahl kennen, die als Interquartilbereich (IQR) bezeichnet wird. Durch Subtrahieren des ersten Quartils vom dritten Quartil wird der IQR abgeleitet, und durch Verwenden verschiedener Software oder wissenschaftlicher Taschenrechner können diese Zahl und die Fünf-Zahlen-Zusammenfassung auch durch Eingeben aller Daten erhalten werden. Der IQR ist wichtig, da sich die von der Box ausgehenden Linien normalerweise nur bis zum 1,5-fachen des IQR erstrecken. Daten jenseits dieses Punktes werden durch Punkte anstelle einer durchgehenden Linie angezeigt. Diese Punkte deuten oft darauf hin, dass die Daten Ausreißer haben.
Für das Box-Plot gibt es eine Vielzahl von Verwendungsmöglichkeiten. Über einer Zahlenlinie können mehrere Diagramme gezeichnet werden, mit denen ähnliche Datensätze verglichen werden können, die sich durch einen wichtigen Faktor unterscheiden. Beispielsweise können Wissenschaftler oder Statistiker die Herzfrequenz von Männern und Frauen aufzeichnen und dann zwei gestapelte Box-Plots erstellen, um nach signifikanten Unterschieden in Reichweite und Quartilen zu suchen.
Box-Plots behandeln nicht die Datenhäufigkeit. Durch das Fehlen einer zusätzlichen Skala (vertikal oder horizontal) werden Informationen zu sich wiederholenden Zahlen, zur Datensatzgröße und zu den meisten einzelnen Zahlen weggelassen. Die Person, die einen Box-Plot betrachtet, versteht am besten die Zusammenfassung der fünf Zahlen, den Bereich und, ob die Daten Ausreißer enthalten. Die Größe der Box, das Verhältnis von Median zu Quartilen und die Länge der Whisker können zeigen, ob die Daten verzerrt sind, sie können jedoch nicht mit Dingen wie Mittelwert, Modus oder Standardabweichung in Verbindung gebracht werden. Andere Diagramme wie Histogramme sind möglicherweise nützlicher, wenn Benutzer beispielsweise die Häufigkeit darstellen oder bessere Darstellungen der Datenverteilung erhalten möchten.