O que é distribuição do histograma?

A distribuição do histograma nas estatísticas refere -se aos padrões, formas e locais das barras de dados univariadas em um histograma. Como e onde as barras são distribuídas podem ser usadas para analisar e tirar conclusões sobre os dados. A análise de distribuição do histograma é importante na identificação de características como normalidade de dados, distribuições multimodais e dados distorcidos. Os pontos de dados no histograma são organizados em caixas e a distribuição do histograma em si é uma aproximação visual da função de distribuição de frequência ou densidade de probabilidade dos dados. A forma da distribuição pode mudar com base no número de caixas. Embora existam métodos analíticos para determinar a normalidade, os histogramas podem ser usados ​​para fornecer uma verificação rápida e comum para economizar tempo. Se os dados do histograma aparecerem aproximadamente uniformes e centrados na média, os dados são assumidos como normais. Embora rápido e relativamente fácil, esse tipo de verificação qualitativa é subjetivo e os métodos analíticos devem ser usados ​​se for necessário um padrão mais alto de precisão.

Determinar se um conjunto de dados exibe assimetria é outra maneira pela qual a análise de distribuição de histograma pode ser usada. A assimetria de dados é definida como assimetria pronunciada nos dados. A inclinação negativa, ou distorcida à esquerda, é vista em conjuntos de dados com muito poucos valores baixos. Skew positiva, ou distorcida à direita, ocorre em conjuntos de dados com poucos valores altos. Observar a distribuição do histograma pode revelar outliers e dados distorcidos.

Além de revelar as características dos dados com um único modo, a forma de um histograma também pode revelar características dos dados multimodais. Conjuntos de dados multimodais contêm mais de um modo e são caracteresized por distribuições de frequência que possuem mais de um pico ou máximo. Afiliações políticas em uma cidade, pesquisas de opinião de aprovação e tamanhos corporais de abelhas são exemplos de conjuntos de dados que podem ser multimodais. Observar a forma do histograma e observar os vários picos em dados multimodais geralmente pode fornecer a um pesquisador mais informações do que os cálculos estatísticos simples univariados.

A análise de histogramas e a distribuição de dados são altamente dependentes dos tamanhos de compartimento escolhido. Na prática, o número de caixotes pode ser estimado com a raiz quadrada do número de observações, embora outros tamanhos de compartimento possam ser usados. Por exemplo, um professor pode optar por analisar as notas de teste, escolhendo tamanhos de caixa que refletem as notas das cartas.

OUTRAS LÍNGUAS

Este artigo foi útil? Obrigado pelo feedback Obrigado pelo feedback

Como podemos ajudar? Como podemos ajudar?