スキュー分布とは
歪んだ分布とは、本質的に不均一で非対称な確率分布を指します。 形状が釣鐘曲線に似ている標準正規分布とは異なり、歪んだ分布は片側にシフトし、中央値の反対側に比べて片側に長いテールを持ちます。 曲線の反対側には、データポイントの大部分が発生する値のクラスター化されたピークがあります。 このタイプの分布曲線は通常、曲線のシフトの方向に応じて、正のスキューまたは負のスキューのいずれかに分類されます。
一般に、曲線のテールが左側と比較して右側で長い場合、スキュー分布は正のスキューを持つと言われます。 この歪んだ分布は、右側にデータポイントのより広い拡張があるため、右に歪んだとも呼ばれます。 正のスキュー曲線は、曲線の左側に向かって最大数の値を持ちます。
対照的に、負に歪んだ分布では、曲線の右側に最も多くのデータポイントがあります。 これらの曲線は左側に長いテールを持っているため、左側に傾いていると言われています。 スキューの方向を決定する際の重要なルールは、平均または中央値の位置ではなく、テールの長さを考慮することです。 これは、スキューが最終的にグラフのその側に向かって曲線を引き伸ばす最も遠い値によって引き起こされるためです。
歪んだ分布の特性を理解することは、多くの統計アプリケーションで重要です。 多くの人々は、データが釣鐘曲線または正規分布に従うと想定しているため、グラフの歪度はゼロであると想定しています。 ただし、これらの仮定は、実際の分布に関する情報を誤って解釈する可能性があります。
歪んだ分布は本質的に不均一であるため、標準偏差などの標準正規パターンに従いません。 正規分布には、曲線の両側に適用される1つの標準偏差が含まれますが、歪んだ分布には、曲線の各側で異なる標準偏差値が含まれます。 これは、2つの側面が互いの鏡像ではないため、一方の側面を表す方程式を他方に適用できないためです。 通常、標準偏差値は、テールが長い側の方が大きくなります。これは、テールが短い側と比較すると、その側のデータの広がりが大きいためです。