¿Qué es la distribución sesgada?
Una distribución sesgada se refiere a una distribución de probabilidad que es desigual y de naturaleza asimétrica. A diferencia de una distribución normal estándar, que se asemeja a una curva de campana en forma, las distribuciones sesgadas se desplazan hacia un lado, poseyendo una cola más larga en un lado en relación con el otro lado de la mediana. El otro lado de la curva poseerá un pico de valores agrupados donde se produce la mayoría de los puntos de datos. Este tipo de curva de distribución generalmente se clasifica como que tiene un sesgo positivo o uno negativo, dependiendo de la dirección del desplazamiento de la curva.
En general, se dice que una distribución sesgada posee una inclinación positiva si la cola de la curva es más larga en el lado derecho en comparación con el lado izquierdo. Esta distribución sesgada también se conoce como sesgada a la derecha porque el lado derecho posee una extensión más amplia de puntos de datos. Las curvas de inclinación positivas poseen el mayor número de valores hacia el lado izquierdo de la curva.
En contraste, las distribuciones sesgadas negativamente poseen la mayor cantidad de puntos de datos en el lado derecho de la curva. Estas curvas tienen colas más largas en los lados izquierdos, por lo que se dice que están sesgadas a la izquierda. Una regla importante para determinar la dirección del sesgo es considerar la longitud de la cola en lugar de la ubicación de la media o la mediana. Esto se debe a que la asimetría es causada en última instancia por los valores periféricos más lejanos, que extienden la curva hacia ese lado del gráfico.
Comprender las propiedades de una distribución sesgada es importante en muchas aplicaciones estadísticas. Muchas personas suponen que los datos siguen una curva de campana, o distribución normal, por lo que también suponen que un gráfico tiene un sesgo cero. Sin embargo, estos supuestos podrían llevarlos a malinterpretar información sobre la distribución real.
Una distribución sesgada es de naturaleza inherentemente desigual, por lo que no seguirá patrones normales estándar como la desviación estándar. Las distribuciones normales implican una desviación estándar que se aplica a ambos lados de la curva, pero las distribuciones sesgadas tendrán valores de desviación estándar diferentes para cada lado de la curva. Esto se debe a que los dos lados no son imágenes especulares entre sí, por lo que las ecuaciones que describen un lado no se pueden aplicar al otro. El valor de la desviación estándar generalmente es mayor para el lado con la cola más larga porque hay una mayor difusión de datos en ese lado en comparación con la cola más corta.