¿Qué es una curva de distribución de frecuencia?
Una curva de distribución de frecuencia es un tipo de estadística descriptiva representada como un gráfico que demuestra la frecuencia de la ocurrencia de una variable dada, donde x representa alguna medida de la ocurrencia de la variable e y representa el número de casos en cada frecuencia. Con poblaciones muy grandes, se dice que una curva de distribución de frecuencia se asemeja al ideal estadístico de una curva de campana y asume las propiedades de una distribución normal. La curva de campana, también conocida como curva normal , se llama acertadamente. Se asemeja a una campana redondeada con extremos simétricos que se estrechan hacia abajo y hacia afuera a una frecuencia cero en el eje x. La curva de campana está dividida en dos por la media (μ) idealizada, la mediana y la moda de todos los datos medidos, con la mitad de cada gráfico a cada lado.
Cuando se supone que una curva de distribución de frecuencia de muestra posee las propiedades de una curva de campana ideal, entonces también se puede suponer aspectos de la población en estudio. Además, las fórmulas estadísticas estándar pueden proporcionar un grado en el que se puede confiar en tales supuestos. Con la curva de campana ideal, se supone que la media, la mediana y la moda de una población son iguales. El cálculo de la desviación estándar, σ, da una medida de la "dispersión" de los datos de la población. En la curva ideal, todos menos el 0.25 por ciento de los datos totales de una población se encuentran dentro de más o menos tres desviaciones estándar de la media de la curva de distribución de frecuencia, o entre μ-3σ y μ + 3σ.
Si bien la curva de campana ideal difiere de una curva de distribución de frecuencia de muestra de varias maneras, permite una comprensión supuesta tanto de la población de muestra como de la ubicación de una sola medición dentro de la población de muestra general. En una curva ideal, el 68 por ciento de los valores para la variable medida en la muestra, y presumiblemente en la población, estará dentro de una desviación estándar de la media en cualquier dirección, o μ-1σ y μ + 1σ. Avanzando a lo largo de la curva de campana, los valores para el 95 por ciento de la muestra y la población se ubicarán dentro de más o menos dos desviaciones estándar de la media, o μ-2σ y μ + 2σ. En los extremos de la curva de distribución de frecuencia, todos menos el 0.25 por ciento se encuentran dentro de más o menos tres desviaciones estándar. Esas mediciones raras que se encuentran en el 0.25 por ciento más allá de las medidas de tres desviaciones estándar se conocen como valores atípicos y a menudo se eliminan de los datos cuando se realizan cálculos inferenciales.