Was ist eine kategoriale Variable?
Eine kategoriale Variable, die auch als Nennvariable bezeichnet wird, ist ein Variablentyp, dem zwei oder mehr Gruppen oder Kategorien zugewiesen werden können. Es gibt keine Reihenfolge für die Kategorien, denen eine Variable zugewiesen werden kann. Mit anderen Worten, die Kategorien können nicht von der höchsten zur niedrigsten geordnet werden. Ein Beispiel für eine kategoriale Variable ist die Rasse, die viele verschiedene Kategorien hat, für die es jedoch keine Reihenfolge gibt.
Eine Möglichkeit, den Variablentyp zu bestimmen, besteht darin, ob er quantitativ oder qualitativ ist. Eine quantitative Variable kann gemessen werden und hat einen bestimmten numerischen Wert. Beispiele für quantitative Variablen sind Größe, Gewicht, Alter, Gehalt, Temperatur usw. Alle nicht quantitativen Variablen sind qualitative oder kategoriale Variablen. Diese Arten von Variablen haben keine numerische Bedeutung, wenn sie gemessen oder beobachtet werden, und umfassen Dinge wie Haarfarbe, Augenfarbe, Geschlecht, Geburtsort usw.
Kategoriale Variablen ähneln ordinalen Variablen, da beide spezifische Kategorien haben, die sie beschreiben. Der Unterschied zwischen einer kategorialen und einer ordinalen Variablen besteht darin, dass letztere eine innere Ordnung haben. In einer Umfrage werden die Befragten beispielsweise gebeten, Aussagen als schlecht, gut und ausgezeichnet einzustufen. Dies sind kategoriale Variablen, aber es gibt eine offensichtliche Reihenfolge. Es handelt sich also tatsächlich um ordinale Variablen.
Datentabellen werden normalerweise verwendet, um Daten zu analysieren, die nach Kategorien gruppiert sind. Mit einer Zweiwege-Datentabelle können zwei kategoriale Variablen gemessen und verglichen werden. Beispielsweise könnten Haarfarbe und Geschlecht für eine Gruppe von Personen gemessen werden. Die kategorialen Variablen, die beobachtet und aufgezeichnet würden, wären, ob die Person männlich oder weiblich ist und welche Farbe ihre Haare haben. In der Tabelle wird die Anzahl der Beobachtungen für jede Gruppe für die beiden Variablen in Zeilen und Spalten basierend auf den gesammelten Daten eingegeben.
Balkendiagramme werden häufig als grafische Methode zur Analyse von kategorialen variablen Daten verwendet. Die beobachteten Daten können als Rohzahlen oder als Prozentsätze eingegeben werden, die bevorzugt werden. Mit einem Balkendiagramm wird die Summe für jede Gruppe angezeigt.
Im obigen Beispiel könnte das Balkendiagramm die Anzahl der Männer oder Frauen oder die Anzahl der Personen innerhalb jeder Kategorie von Haarfarben darstellen. Ein segmentiertes Balkendiagramm kann eine Methode zum Anzeigen der während der Beobachtungen erfassten Zahlen anstelle einer geraden Summe für jede Gruppe bereitstellen. Unter Verwendung der gleichen Haarfarbe- und Geschlechtsdaten könnte ein segmentiertes Balkendiagramm zeigen, wie viele Männer und Frauen jeder Haarfarbe beobachtet wurden.