ヒストグラム分布とは
統計のヒストグラム分布は、ヒストグラム上の単変量データバーのパターン、形状、および場所を指します。 バーをどのように、どこに分布させるかを使用して、データについて分析し、結論を導き出すことができます。 ヒストグラム分布分析は、データの正規性、マルチモーダル分布、歪んだデータなどの特性を識別するのに重要です。
ヒストグラムは単変量データ表示であり、面積に比例する長方形を使用して頻度をクラス化またはビン化して、データの特徴を視覚的に表示します。 ヒストグラムのデータポイントはビンに編成され、ヒストグラム分布自体はデータの頻度分布または確率密度関数の視覚的な近似です。 分布の形状は、ビンの数に基づいて変更できます。
ヒストグラム分布分析は、データの正規性の定性チェックとしてよく使用されます。 正規性を判断するための分析方法は存在しますが、ヒストグラムを使用して、迅速で常識的なチェックを提供し、時間を節約できます。 ヒストグラムデータがほぼ均等に表示され、平均を中心とする場合、データは正常であると見なされます。 迅速で比較的簡単ですが、この種の定性チェックは主観的であり、より高い精度の基準が必要な場合は分析方法を使用する必要があります。
データセットが歪度を示すかどうかを判断することは、ヒストグラム分布分析を使用できる別の方法です。 データの歪度は、データの顕著な非対称性として定義されます。 負のスキュー、または左へのスキューは、低い値がほとんどないデータセットで見られます。 正のスキュー、または右へのスキューは、高い値の少ないデータセットで発生します。 ヒストグラム分布を観察すると、外れ値と歪んだデータが明らかになる可能性があります。
単一モードでデータの特性を明らかにすることに加えて、ヒストグラムの形状はマルチモーダルデータの特性も明らかにすることができます。 マルチモーダルデータセットには複数のモードが含まれ、複数のピークまたは最大値を持つ頻度分布によって特徴付けられます。 町の政治的所属、承認意見調査、ミツバチの体の大きさは、マルチモーダルなデータセットの例です。 ヒストグラムの形状を観察し、マルチモーダルデータのさまざまなピークに注目すると、単純な単変量統計計算よりも多くの洞察を研究者に提供できます。
ヒストグラムの分析とデータの分布は、選択したビンのサイズに大きく依存します。 実際には、観測数の平方根を取ることでビンの数を推定できますが、他のビンのサイズを使用することもできます。 たとえば、教師は文字の評点を反映するビンのサイズを選択して、テストの評点を分析することを選択できます。