Co je kategorická proměnná?
Kategorická proměnná, která je také označována jako nominální proměnná, je typ proměnné, který může mít dvě nebo více skupin nebo kategorií, které lze přiřadit. Neexistuje žádné pořadí kategorií, ke kterým lze proměnnou přiřadit. Jinými slovy, kategorie nelze uspořádat od nejvyšší po nejnižší. Příkladem kategorické proměnné je rasa, která má mnoho různých kategorií, ale není jim nařízeno.
Jedním ze způsobů, jak určit typ proměnné, je, zda je kvantitativní nebo kvalitativní. Kvantitativní proměnná může být měřena a má specifickou číselnou hodnotu. Příklady kvantitativních proměnných zahrnují výšku, hmotnost, věk, plat, teplotu atd. Jakékoli proměnné, které nejsou kvantitativní, jsou kvalitativní nebo kategorická proměnná. Tyto typy proměnných nemají při měření nebo pozorování žádný numerický význam a zahrnují například barvu vlasů, barvu očí, pohlaví, město narození atd.
Kategorické proměnné jsou podobné ordinálním proměnným, protože obě mají specifické kategorie, které je popisují. Rozdíl mezi kategorickou proměnnou a ordinální proměnnou je ten, že tato proměnná má vnitřní řád. Například průzkum může požadovat, aby respondenti hodnotili prohlášení jako špatné, dobré a vynikající. Jedná se o kategorické proměnné, ale je zde zřejmé pořadí, takže jsou ve skutečnosti řadovými proměnnými.
Datové tabulky se obvykle používají k analýze dat, která jsou kategoricky seskupena. S dvousměrnou datovou tabulkou lze měřit a porovnávat dvě kategorické proměnné. Například barvu vlasů a pohlaví lze měřit pro skupinu jednotlivců. Kategorickými proměnnými, které by se pozorovaly a zaznamenávaly, by bylo, zda je osoba muž nebo žena a jaká je jeho barva vlasů. V tabulce by počet pozorování pro každou skupinu pro tyto dvě proměnné byl zapsán do řádků a sloupců na základě shromážděných údajů.
Sloupcové grafy jsou často používány jako grafická metoda analýzy dat kategoriálních proměnných. Pozorovaná data lze zadat jako hrubá čísla nebo jako procenta, která jsou preferována. U sloupcového grafu je zobrazen součet pro každou skupinu.
Ve výše uvedeném příkladu by sloupcový graf mohl představovat počet mužů a žen nebo počet jedinců v každé kategorii barvy vlasů. Segmentovaný sloupcový graf může poskytnout metodu zobrazování čísel získaných během pozorování namísto přímého součtu pro každou skupinu. Při použití stejných údajů o barvě vlasů a pohlaví může segmentovaný sloupcový graf ukázat, kolik mužů a žen každé barvy vlasů bylo pozorováno.