Co to jest skośna dystrybucja?
Rozkład przekrzywiony odnosi się do rozkładu prawdopodobieństwa, który jest nierównomierny i asymetryczny z natury. W przeciwieństwie do standardowego rozkładu normalnego, który przypomina kształt krzywej dzwonowej, przekrzywione rozkłady są przesunięte na jedną stronę, posiadając dłuższy ogon z jednej strony względem drugiej strony środkowej. Druga strona krzywej będzie miała skupiony pik wartości, w którym występuje większość punktów danych. Ten typ krzywej rozkładu jest zwykle klasyfikowany jako mający dodatnią lub ujemną krzywą, w zależności od kierunku przesunięcia krzywej.
Mówi się, że rozkład skośny ma dodatnie pochylenie, jeśli ogon krzywej jest dłuższy po prawej stronie w porównaniu do lewej strony. Ten przekrzywiony rozkład jest również określany jako przekrzywiony w prawo, ponieważ prawa strona ma szersze rozszerzenie punktów danych. Dodatnie krzywe pochylenia mają największą liczbę wartości w kierunku lewej strony krzywej.
Natomiast ujemnie wypaczone rozkłady zawierają najwięcej punktów danych po prawej stronie krzywej. Krzywe te mają dłuższe ogony po lewej stronie, więc mówi się, że są pochylone w lewo. Ważną zasadą przy określaniu kierunku skosu jest wzięcie pod uwagę długości ogona, a nie umiejscowienia średniej lub mediany. Wynika to z faktu, że pochylenie jest ostatecznie powodowane przez najbardziej oddalone wartości, które rozciągają krzywą w kierunku tej strony wykresu.
Zrozumienie właściwości przekrzywionego rozkładu jest ważne w wielu zastosowaniach statystycznych. Wiele osób zakłada, że dane są zgodne z krzywą dzwonową lub rozkładem normalnym, dlatego też zakładają, że wykres ma zerową skośność. Te założenia mogą jednak prowadzić do błędnej interpretacji informacji o rzeczywistym rozkładzie.
Przekrzywiony rozkład jest z natury nierównomierny, więc nie będzie zgodny ze standardowymi wzorcami normalnymi, takimi jak odchylenie standardowe. Rozkłady normalne obejmują jedno odchylenie standardowe, które stosuje się po obu stronach krzywej, ale rozkłady skośne będą miały różne wartości odchyleń standardowych dla każdej strony krzywej. Wynika to z faktu, że obie strony nie są lustrzanymi odbiciami, więc równania opisujące jedną stronę nie mogą być zastosowane do drugiej. Wartość odchylenia standardowego jest na ogół większa dla strony z dłuższym ogonem, ponieważ po tej stronie jest większy rozkład danych w porównaniu do krótszego ogona.