O que são classes de histograma?
Classes de histograma são intervalos de valores que contêm pontos de dados em uma distribuição de frequência ou tabulação de dados brutos. Eles também são chamados de intervalos, compartimentos ou larguras de compartimento. Em um histograma, um tipo de gráfico de barras, essas classes são representadas como colunas verticais, onde a altura da coluna indica o número de pontos de dados contidos no intervalo de classes. Normalmente, a escolha da classe do histograma é feita para aprimorar a representação visual das estatísticas ou tendências dos dados.
Quando há uma grande quantidade de dados a serem exibidos, um histograma é particularmente útil para representar a forma de sua distribuição. Um intervalo inteiro de dados é dividido em intervalos e o número de pontos de dados que se enquadram em cada um é contado para fornecer a frequência da classe. A faixa ou largura do intervalo determina o número de classes de histograma e influencia a forma do gráfico.
Se o intervalo for muito amplo, informações significativas podem ser omitidas pelas classes sendo muito inclusivas. Quando a escolha da largura do intervalo é muito estreita, a frequência de classe baixa pode dar importância indevida ao que é realmente uma variação aleatória. Existem vários métodos para definir um número apropriado de classes de histograma para um conjunto de dados.
De acordo com a regra de Sturgis, o número de classes deve estar próximo ao log base 2 do número de pontos de dados, mais um. Usando a regra de Rice, o número de classes definidas deve ser duas vezes a raiz do cubo do número de pontos de dados. Qualquer que seja o método usado na seleção do número de classes de histograma, várias larguras diferentes devem ser tentadas para testar a sensibilidade da forma do histograma ao tamanho da classe. O número correto de classes é aquele que descreve com mais precisão a distribuição dos dados.
Com o número adequado de classes de histograma para um intervalo de dados, deve resultar uma representação gráfica significativa que permita uma interpretação clara. Um histograma deve mostrar o centro e a dispersão dos dados, qualquer assimetria ou assimetria de dados e valores extremos ou pontos de dados que ocorram fora do intervalo esperado de valores. O modo, ou o valor que ocorre com mais frequência, deve ser aparente, bem como agrupamentos que possam indicar uma modalidade múltipla. A análise do histograma também pode indicar falhas no processo de coleta de dados.
Há muito utilizado nas finanças e nas ciências sociais, os histogramas estão se tornando mais familiares nas telas gráficas de eletrônicos de consumo. A fotografia digital é particularmente aberta ao seu uso, com muitas câmeras incorporando um histograma colorido para indicar balanço de branco e exposição. Um histograma de fotografia digital também pode mostrar pixels como classes de histograma plotadas em tons de cinza.