¿Qué es la distribución del histograma?

La distribución del histograma en estadísticas se refiere a los patrones, formas y ubicaciones de barras de datos univariadas en un histograma. Cómo y dónde se distribuyen las barras se puede usar para analizar y sacar conclusiones sobre los datos. El análisis de distribución de histogramas es importante para identificar rasgos como la normalidad de los datos, las distribuciones multimodales y los datos sesgados.

Un histograma es una pantalla de datos univariada que utiliza rectángulos proporcionales en el área a la clase o frecuencias de bin para mostrar visualmente las características de los datos. Los puntos de datos en el histograma se organizan en contenedores y la distribución del histograma en sí es una aproximación visual de la distribución de frecuencia de los datos o la función de densidad de probabilidad. La forma de la distribución puede cambiar en función del número de contenedores.

El análisis de distribución del histograma a menudo se usa como una verificación cualitativa para la normalidad de los datos. Aunque existen métodos analíticos para determinar la normalidad, los histogramas se pueden usar para proporcionar una verificación rápida y de sentido común para ahorrar tiempo. Si los datos del histograma aparecen aproximadamente uniformes y centrados en la media, se supone que los datos son normales. Aunque rápido y relativamente fácil, este tipo de verificación cualitativa es subjetiva y los métodos analíticos deben usarse si se requiere un estándar de precisión más alto.

Determinar si un conjunto de datos exhibe asimetría es otra forma en que se puede usar el análisis de distribución de histograma. La asimetría de datos se define como asimetría pronunciada en los datos. El sesgo negativo, o sesgo hacia la izquierda, se ve en conjuntos de datos con muy pocos valores bajos. El sesgo positivo, o sesgando hacia la derecha, ocurre en conjuntos de datos con pocos valores altos. Observar la distribución del histograma puede revelar valores atípicos y datos sesgados.

Además de revelar las características de los datos con un solo modo, la forma de un histograma también puede revelar las características de los datos multimodales. Los conjuntos de datos multimodales contienen más de un modo y son carácterIzed por distribuciones de frecuencia que tienen más de un pico o máximos. Las afiliaciones políticas en una ciudad, las encuestas de opinión de aprobación y el tamaño del cuerpo de las abejas son ejemplos de conjuntos de datos que pueden ser multimodales. Observar la forma del histograma y observar los diversos picos en los datos multimodales a menudo puede proporcionar a un investigador más información que los cálculos estadísticos univariados simples.

El análisis de los histogramas y la distribución de datos dependen en gran medida de los tamaños de contenedor elegidos. En la práctica, el número de contenedores se puede estimar tomando la raíz cuadrada del número de observaciones, aunque se pueden usar otros tamaños de contenedor. Por ejemplo, un maestro puede optar por analizar las calificaciones de las pruebas eligiendo los tamaños de contenedor que reflejan las calificaciones de letras.

OTROS IDIOMAS