O que é distribuição enviesada?
Uma distribuição inclinada refere-se a uma distribuição de probabilidade de natureza desigual e assimétrica. Diferentemente de uma distribuição normal padrão, que se assemelha a uma curva em forma de sino, as distribuições inclinadas são deslocadas para um lado, possuindo uma cauda mais longa em um lado em relação ao outro lado da mediana. O outro lado da curva possuirá um pico agrupado de valores onde a maioria dos pontos de dados ocorre. Esse tipo de curva de distribuição é geralmente classificado como tendo uma inclinação positiva ou uma inclinação negativa, dependendo da direção do deslocamento da curva.
Geralmente, diz-se que uma distribuição inclinada possui inclinação positiva se a cauda da curva for mais longa no lado direito quando comparado ao lado esquerdo. Essa distribuição inclinada também é chamada de inclinada para a direita porque o lado direito possui uma extensão mais ampla de pontos de dados. As curvas de inclinação positiva possuem o maior número de valores em direção ao lado esquerdo da curva.
Por outro lado, distribuições inclinadas negativamente possuem o maior número de pontos de dados no lado direito da curva. Essas curvas têm caudas mais longas no lado esquerdo e, portanto, são inclinadas para a esquerda. Uma regra importante para determinar a direção da inclinação é considerar o comprimento da cauda e não a localização da média ou mediana. Isso ocorre porque, em última análise, a inclinação é causada pelos valores mais distantes, que esticam a curva em direção ao lado do gráfico.
Compreender as propriedades de uma distribuição inclinada é importante em muitas aplicações estatísticas. Muitas pessoas assumem que os dados seguem uma curva em forma de sino ou distribuição normal, portanto, também assumem que um gráfico tem assimetria zero. Essas suposições, no entanto, podem levá-las a interpretar mal as informações sobre a distribuição real.
Uma distribuição assimétrica é inerentemente desigual por natureza, portanto não segue padrões normais padrão, como desvio padrão. As distribuições normais envolvem um desvio padrão que se aplica a ambos os lados da curva, mas as distribuições inclinadas terão valores de desvio padrão diferentes para cada lado da curva. Isso ocorre porque os dois lados não são imagens espelhadas um do outro, portanto as equações que descrevem um lado não podem ser aplicadas ao outro. O valor do desvio padrão geralmente é maior para o lado com a cauda mais longa, porque há uma propagação mais ampla de dados nesse lado quando comparado à cauda mais curta.