Qu'est-ce qu'une variable catégorique?
Une variable catégorielle, également appelée variable nominale, est un type de variable pouvant avoir deux groupes ou plus, ou catégories, pouvant être attribués. Il n'y a pas d'ordre dans les catégories auxquelles une variable peut être assignée. En d'autres termes, les catégories ne peuvent pas être classées du plus haut au plus bas. Un exemple de variable catégorique est la race, qui comporte de nombreuses catégories différentes, mais ne les ordonne pas.
Une façon de déterminer le type de variable est de savoir s'il est quantitatif ou qualitatif. Une variable quantitative peut être mesurée et possède une valeur numérique spécifique. La taille, le poids, l'âge, le salaire, la température, etc. sont des exemples de variables quantitatives. Toutes les variables non quantitatives sont qualitatives ou catégoriques. Ces types de variables n'ont aucune signification numérique lorsqu'elles sont mesurées ou observées et incluent des éléments tels que la couleur des cheveux, la couleur des yeux, le sexe, la ville de naissance, etc.
Les variables catégorielles sont similaires aux variables ordinales car elles ont toutes les deux des catégories spécifiques qui les décrivent. La différence entre une variable catégorielle et une variable ordinale est que cette dernière a un ordre intrinsèque. Par exemple, une enquête peut demander aux répondants de classer les déclarations comme mauvaises, bonnes et excellentes. Ce sont des variables catégoriques, mais l'ordre est évident, ce sont donc des variables ordinales.
Les tableaux de données sont généralement utilisés pour analyser des données catégorisées. Avec un tableau de données bidirectionnel, deux variables catégorielles peuvent être mesurées et comparées. Par exemple, la couleur des cheveux et le sexe pourraient être mesurés pour un groupe d'individus. Les variables catégoriques qui seraient observées et enregistrées seraient le fait que la personne soit un homme ou une femme et la couleur de ses cheveux. Dans le tableau, le nombre d'observations de chaque groupe pour les deux variables serait entré en lignes et en colonnes en fonction des données collectées.
Les graphiques à barres sont souvent utilisés comme méthode graphique d'analyse de données variables qualitatives. Les données observées peuvent être entrées sous forme de nombres bruts ou de pourcentages, ce qui est préférable. Avec un graphique à barres, le total de chaque groupe est affiché.
Dans l'exemple ci-dessus, l'histogramme pourrait représenter le nombre d'hommes ou de femmes ou le nombre d'individus dans chaque catégorie de couleur de cheveux. Un diagramme à barres segmenté peut fournir une méthode permettant d’afficher les nombres capturés lors des observations au lieu d’un total simple pour chaque groupe. En utilisant les mêmes données de couleur de cheveux et de sexe, un diagramme à barres segmenté pourrait montrer combien de mâles et de femmes de chaque couleur de cheveux ont été observés.