Que sont les classes d'histogramme?
Les classes d'histogrammes sont des plages de valeurs contenant des points de données dans une distribution de fréquence ou une tabulation de données brutes. Ils sont également appelés intervalles, bacs ou largeurs de bacs. Dans un histogramme, un type de graphique à barres, ces classes sont représentées sous forme de colonnes verticales où la hauteur de la colonne indique le nombre de points de données contenus dans la plage de classes. Généralement, le choix de la classe d'histogramme est fait pour améliorer la représentation visuelle des statistiques ou des tendances de données.
Lorsqu'il y a une grande quantité de données à afficher, un histogramme est particulièrement utile pour décrire la forme de sa distribution. Une gamme complète de données est divisée en intervalles et le nombre de points de données entrant dans chacun est compté pour donner la fréquence de classe. La plage ou la largeur de l'intervalle détermine le nombre de classes d'histogramme et influe sur la forme du graphique.
Si l'intervalle est trop large, des informations importantes peuvent être omises car les classes sont trop inclusives. Lorsque le choix de la largeur de l'intervalle est trop étroit, une fréquence de classe faible peut accorder une importance excessive à ce qui constitue en réalité une variation aléatoire. Il existe plusieurs méthodes pour définir un nombre approprié de classes d'histogramme pour un jeu de données.
Selon la règle de Sturgis, le nombre de classes devrait être proche du journal de base 2 du nombre de points de données, plus un. En utilisant la règle de Rice, le nombre de classes définies doit être le double de la racine cubique du nombre de points de données. Quelle que soit la méthode utilisée pour sélectionner le nombre de classes d'histogramme, plusieurs largeurs différentes doivent être essayées pour tester la sensibilité de la forme de l'histogramme à la taille de la classe. Le nombre correct de classes est celui qui décrit le plus précisément la distribution des données.
Avec le nombre approprié de classes d'histogrammes pour une plage de données, il convient d'obtenir une représentation graphique explicite permettant une interprétation claire. Un histogramme doit indiquer le centre et la dispersion des données, les asymétries ou asymétries de données, ainsi que les points aberrants ou les points de données situés en dehors de la plage de valeurs attendue. Le mode, ou la valeur la plus fréquente, devrait être apparent, ainsi que les regroupements pouvant indiquer une modalité multiple. L'analyse par histogramme peut également indiquer des erreurs dans le processus de collecte de données.
Utilisés depuis longtemps en finance et en sciences sociales, les histogrammes sont de plus en plus utilisés dans les affichages graphiques de l'électronique grand public. La photographie numérique est particulièrement ouverte à leur utilisation, de nombreux appareils photo intégrant un histogramme de couleur pour indiquer la balance des blancs et l'exposition. Un histogramme de photographie numérique peut également afficher les pixels sous forme de classes d’histogrammes par rapport à des nuances de gris.