O que é distribuição de histograma?

A distribuição do histograma nas estatísticas refere-se aos padrões, formas e locais das barras de dados univariadas em um histograma. Como e onde as barras são distribuídas podem ser usadas para analisar e tirar conclusões sobre os dados. A análise da distribuição do histograma é importante na identificação de características como normalidade dos dados, distribuições multimodais e dados distorcidos.

Um histograma é uma exibição de dados univariada que usa retângulos proporcionais em área para classe ou frequências de compartimento para mostrar visualmente os recursos dos dados. Os pontos de dados no histograma são organizados em compartimentos e a própria distribuição do histograma é uma aproximação visual da função de distribuição de frequência ou densidade de probabilidade dos dados. A forma da distribuição pode mudar com base no número de posições.

A análise de distribuição do histograma é frequentemente usada como uma verificação qualitativa da normalidade dos dados. Embora existam métodos analíticos para determinar a normalidade, os histogramas podem ser usados ​​para fornecer uma verificação rápida e de bom senso para economizar tempo. Se os dados do histograma parecerem praticamente uniformes e centralizados na média, presume-se que os dados sejam normais. Embora rápido e relativamente fácil, esse tipo de verificação qualitativa é subjetiva e métodos analíticos devem ser utilizados se for necessário um padrão de precisão mais alto.

Determinar se um conjunto de dados exibe distorção é outra maneira de a análise de distribuição do histograma ser usada. A assimetria dos dados é definida como assimetria acentuada nos dados. A inclinação negativa, ou inclinada para a esquerda, é vista em conjuntos de dados com muito poucos valores baixos. A inclinação positiva ou a direita ocorre em conjuntos de dados com poucos valores altos. Observar a distribuição do histograma pode revelar valores discrepantes e distorcidos.

Além de revelar as características dos dados em um único modo, a forma de um histograma também pode revelar características dos dados multimodais. Os conjuntos de dados multimodais contêm mais de um modo e são caracterizados por distribuições de frequência que possuem mais de um pico ou máximo. Afiliações políticas em uma cidade, pesquisas de opinião de aprovação e tamanhos de corpos de abelhas são exemplos de conjuntos de dados que podem ser multimodais. Observar a forma do histograma e observar os vários picos nos dados multimodais pode fornecer ao pesquisador mais informações do que simples cálculos estatísticos univariados.

A análise dos histogramas e a distribuição dos dados são altamente dependentes dos tamanhos de compartimento escolhidos. Na prática, o número de compartimentos pode ser estimado usando a raiz quadrada do número de observações, embora outros tamanhos de compartimento possam ser usados. Por exemplo, um professor pode optar por analisar as notas dos testes escolhendo tamanhos de lixeira que refletem as notas das letras.

OUTRAS LÍNGUAS

Este artigo foi útil? Obrigado pelo feedback Obrigado pelo feedback

Como podemos ajudar? Como podemos ajudar?