Che cos'è la distribuzione distorta?
Una distribuzione distorta si riferisce a una distribuzione di probabilità che è di natura irregolare e asimmetrica. A differenza di una distribuzione normale standard, che assomiglia a una curva a campana, le distribuzioni oblique sono spostate su un lato, con una coda più lunga su un lato rispetto all'altro lato della mediana. L'altro lato della curva avrà un picco cluster di valori in cui si verifica la maggior parte dei punti dati. Questo tipo di curva di distribuzione è generalmente classificata come avente un'inclinazione positiva o un'inclinazione negativa, a seconda della direzione dello spostamento della curva.
Generalmente, si dice che una distribuzione inclinata possiede un'inclinazione positiva se la coda della curva è più lunga sul lato destro rispetto al lato sinistro. Questa distribuzione distorta viene anche definita inclinata a destra poiché la parte destra possiede l'estensione più ampia dei punti dati. Le curve di inclinazione positive possiedono il maggior numero di valori verso il lato sinistro della curva.
Al contrario, le distribuzioni inclinate negativamente possiedono il maggior numero di punti dati sul lato destro della curva. Queste curve hanno code più lunghe sul lato sinistro, quindi si dice che siano inclinate a sinistra. Una regola importante nel determinare la direzione dell'inclinazione è considerare la lunghezza della coda anziché la posizione della media o della mediana. Questo perché l'inclinazione è in definitiva causata dai valori periferici più lontani, che allungano la curva verso quel lato del grafico.
Comprendere le proprietà di una distribuzione distorta è importante in molte applicazioni statistiche. Molte persone presumono che i dati seguano una curva a campana o una distribuzione normale, quindi assumono anche che un grafico abbia zero asimmetria. Queste ipotesi, tuttavia, potrebbero indurle a fraintendere informazioni sulla distribuzione effettiva.
Una distribuzione distorta è intrinsecamente irregolare in natura, quindi non seguirà schemi normali standard come la deviazione standard. Le distribuzioni normali comportano una deviazione standard che si applica a entrambi i lati della curva, ma le distribuzioni oblique avranno valori di deviazione standard diversi per ciascun lato della curva. Questo perché i due lati non sono immagini speculari l'uno dell'altro, quindi le equazioni che descrivono un lato non possono essere applicate all'altro. Il valore di deviazione standard è generalmente maggiore per il lato con la coda più lunga poiché esiste una più ampia diffusione di dati su quel lato rispetto alla coda più corta.