Wat is een categorische variabele?
Een categorische variabele, die ook een nominale variabele wordt genoemd, is een type variabele dat twee of meer groepen of categorieën kan hebben die kunnen worden toegewezen. Er is geen volgorde voor de categorieën waaraan een variabele kan worden toegewezen. Met andere woorden, de categorieën kunnen niet in volgorde van hoog naar laag worden geplaatst. Een voorbeeld van een categorische variabele is race, die veel verschillende categorieën heeft, maar er is geen volgorde voor hen.
Een manier om het variabele type te bepalen is of het kwantitatief of kwalitatief is. Een kwantitatieve variabele kan worden gemeten en heeft een specifieke numerieke waarde. Voorbeelden van kwantitatieve variabelen zijn lengte, gewicht, leeftijd, salaris, temperatuur, etc. Alle variabelen die niet kwantitatief zijn, zijn kwalitatief of een categorische variabele. Dit soort variabelen hebben geen numerieke betekenis wanneer ze worden gemeten of waargenomen, en omvatten dingen zoals haarkleur, oogkleur, geslacht, geboortestad, etc.
Categorische variabelen zijn vergelijkbaar met ordinale variabelen omdat ze beide specifieke categorieën hebben die ze beschrijven. Het verschil tussen een categorische variabele en een ordinale variabele is dat deze laatste een intrinsieke volgorde heeft. Een enquête kan bijvoorbeeld vragen dat respondenten uitspraken rangschikken als slecht, goed en uitstekend. Dit zijn categorische variabelen, maar er is een duidelijke volgorde, dus het zijn in feite ordinale variabelen.
Gegevenstabellen worden meestal gebruikt om gegevens te analyseren die categorisch zijn gegroepeerd. Met een tweerichtingsdatatabel kunnen twee categorische variabelen worden gemeten en vergeleken. Haarkleur en geslacht kunnen bijvoorbeeld worden gemeten voor een groep personen. De categorische variabelen die zouden worden waargenomen en vastgelegd zouden zijn of de persoon mannelijk of vrouwelijk is en welke kleur zijn of haar haar heeft. In de tabel zou het aantal observaties voor elke groep voor de twee variabelen worden ingevoerd in rijen en kolommen op basis van de verzamelde gegevens.
Staafdiagrammen worden vaak gebruikt als een grafische methode voor het analyseren van categorische variabele gegevens. De gegevens die worden waargenomen, kunnen worden ingevoerd als ruwe getallen of als percentages, waaraan de voorkeur wordt gegeven. Met een staafdiagram wordt het totaal voor elke groep weergegeven.
In het bovenstaande voorbeeld kan het staafdiagram het aantal mannen of vrouwen of het aantal individuen binnen elke haarkleurcategorie vertegenwoordigen. Een gesegmenteerd staafdiagram kan een methode bieden voor het weergeven van de cijfers die tijdens de observaties zijn vastgelegd in plaats van een recht totaal voor elke groep. Met behulp van dezelfde haarkleur- en geslachtsgegevens kon een gesegmenteerd staafdiagram laten zien hoeveel mannen en vrouwen van elke haarkleur werden waargenomen.