ヒストグラムクラスとは
ヒストグラムクラスは、頻度分布のデータポイントまたは生データの集計を含む値の範囲です。 これらは、間隔、ビン、またはビン幅とも呼ばれます。 棒グラフの一種であるヒストグラムでは、これらのクラスは垂直列として表され、列の高さはクラス範囲に含まれるデータポイントの数を示します。 通常、ヒストグラムクラスの選択は、データの統計または傾向の視覚的表現を強化するために行われます。
表示するデータが大量にある場合、ヒストグラムはその分布の形状を表すのに特に役立ちます。 データの全範囲が間隔に分割され、それぞれに分類されるデータポイントの数がカウントされて、クラス頻度が与えられます。 間隔の範囲または幅は、ヒストグラムクラスの数を決定し、グラフの形状に影響を与えます。
間隔が広すぎる場合、クラスが包括的すぎるために重要な情報が省略される可能性があります。 間隔幅の選択が狭すぎる場合、クラスの頻度が低いと、実際にランダムな変動であることが過度に重要になる場合があります。 データセットに適切な数のヒストグラムクラスを設定するには、いくつかの方法があります。
Sturgisのルールによれば、クラスの数は、データポイントの数の2を底とするログに1を加えた数に近いはずです。 ライスのルールを使用すると、定義されるクラスの数は、データポイントの数のキューブルートの2倍になります。 ヒストグラムクラスの数を選択する際にどちらの方法を使用する場合でも、いくつかの異なる幅を試して、クラスサイズに対するヒストグラム形状の感度をテストする必要があります。 クラスの正しい数は、データの分布を最も正確に表すものです。
ある範囲のデータに対して適切な数のヒストグラムクラスがあれば、明確な解釈を可能にする意味のあるグラフィカルな表現が得られます。 ヒストグラムは、データの中心と広がり、歪度、データの非対称性、外れ値、または予想される値の範囲外で発生したデータポイントを示す必要があります。 モード、または最も頻繁に発生する値は、複数のモダリティを示す可能性のあるグループと同様に明らかである必要があります。 ヒストグラム分析は、データ収集プロセスの障害も示す場合があります。
金融や社会科学で長い間使用されてきたヒストグラムは、家電のグラフィック表示でより身近になりつつあります。 デジタル写真は、特にその使用に開放されており、多くのカメラでは、ホワイトバランスと露出を示すカラーヒストグラムが組み込まれています。 デジタル写真のヒストグラムは、グレーの濃淡に対してプロットされたヒストグラムクラスとしてピクセルを表示することもあります。