Co to jest zmienna kategoryczna?
Zmienna kategoryczna, zwana również zmienną nominalną, jest rodzajem zmiennej, która może mieć dwie lub więcej grup lub kategorii, które można przypisać. Kategorie nie mają kolejności, do której można przypisać zmienną. Innymi słowy, kategorie nie mogą być uporządkowane od najwyższej do najniższej. Przykładem zmiennej kategorialnej jest rasa, która ma wiele różnych kategorii, ale nie ma dla nich kolejności.
Jednym ze sposobów określenia typu zmiennej jest to, czy ma ona charakter ilościowy czy jakościowy. Zmienna ilościowa może zostać zmierzona i ma określoną wartość liczbową. Przykłady zmiennych ilościowych obejmują wzrost, wagę, wiek, wynagrodzenie, temperaturę itp. Wszelkie zmienne, które nie są ilościowe, są jakościowe lub zmienne jakościowe. Te typy zmiennych nie mają znaczenia numerycznego, gdy są mierzone lub obserwowane i obejmują takie rzeczy, jak kolor włosów, kolor oczu, płeć, miasto urodzenia itp.
Zmienne kategoryczne są podobne do zmiennych porządkowych, ponieważ obie mają określone kategorie, które je opisują. Różnica między zmienną kategorialną a zmienną porządkową polega na tym, że ta ostatnia ma wewnętrzny porządek. Na przykład w ankiecie można poprosić respondentów o uszeregowanie wypowiedzi jako słabe, dobre i doskonałe. Są to zmienne kategoryczne, ale istnieje oczywisty porządek, więc w rzeczywistości są to zmienne porządkowe.
Tabele danych są zwykle używane do analizy danych pogrupowanych kategorycznie. Dzięki dwukierunkowej tabeli danych można zmierzyć i porównać dwie zmienne jakościowe. Na przykład kolor włosów i płeć można zmierzyć dla grupy osób. Zmienne jakościowe, które można zaobserwować i zarejestrować, to to, czy dana osoba jest mężczyzną czy kobietą i jakiego koloru są jej włosy. W tabeli liczba obserwacji dla każdej grupy dla dwóch zmiennych zostałaby wprowadzona w wierszach i kolumnach na podstawie zebranych danych.
Wykresy słupkowe są często stosowane jako graficzna metoda analizy danych zmiennych jakościowych. Obserwowane dane można wprowadzić jako liczby surowe lub jako wartości procentowe, które są preferowane. Wykres słupkowy pokazuje sumę dla każdej grupy.
W powyższym przykładzie wykres słupkowy może przedstawiać liczbę mężczyzn lub kobiet lub liczbę osób w każdej kategorii koloru włosów. Segmentowy wykres słupkowy może zapewnić metodę pokazania liczb zarejestrowanych podczas obserwacji zamiast prostej sumy dla każdej grupy. Korzystając z tego samego koloru i płci włosów, podzielony na segmenty wykres słupkowy może pokazywać, ile mężczyzn i kobiet zaobserwowano w każdym kolorze włosów.