頻度表とは
頻度表は、アイテムまたは値の整理された数です。 最も単純な形式では、頻度テーブルは、データセットで特定の各値が発生する頻度を示します。 生データはクラスに編成され、生データに存在する各クラスの数を示すためにカウントされます。 これらのテーブルは、データセットに関する基本的な統計情報を発見するのに役立ちます。
生データセットに少数の値しかない場合、通常は単純な頻度表で十分です。 一部のデータセットは大きすぎたり、組織化されていないため、テーブルを手動で操作することができず、計算機またはコンピューターの支援が必要になる場合があります。 通常、単純な度数分布表は3つの列で構成され、マーク、タリー、頻度として知られるカテゴリを追跡するために使用されます。
通常、マーク列には、データセット内のすべての可能なクラスがリストされます。 たとえば、誰かがコインを30回裏返した場合、データセットには30の値がありますが、頭と尾の2つのクラスしかありません。 一方、3人が25種類のアイスクリームフレーバーのある店からデザートを受け取った場合、データセットには3つの値があり、25の可能なクラスがあります。
データセットが大きい場合、頻度テーブルを作成するプロセスでは、通常、生データをクラス間隔と呼ばれるグループまたは範囲に編成する必要があります 。 これは、数値を扱うときに役立ちます。 たとえば、データセットの最小数が1で、最大数が300の場合、マーク列は、1-50、51-100、101-150などで始まる6つのクラス間隔に分割できます。
次に、組織化されたデータが一般的にカウントされ、データセットで各クラスが発生する回数が決定されます。 単純な度数分布表では、これは通常、クラスの行の隣にある値列またはカウントごとに1回、集計列を手でマークすることによって実現されます。 より複雑なデータセットでは、生データは多くの場合、手作業で集計されるのではなく、コンピューターまたは計算機に入力されます。
頻度表の3番目の列は頻度列です。 これは、各クラスの発生頻度がリストされる場所です。 この列の数値は生データ値ではなく、データセットで各クラスが発生した回数です。 多くの場合、この列は、視覚的に興味深い方法で値を表示するためにグラフまたは円グラフになります。
頻度テーブルは、生データセットに関するいくつかの基本的な統計データを明らかにするのに役立ちます。 データ内の任意のモードまたは最も頻繁に発生する値を表示する場合があります。 これらのテーブルは、中央値または中間値を見つけるのにも役立ちます。これは、データがマーク列で大きさの順に整理されることが多いためです。
頻度表を使用して、データの分布を決定することもできます。 このため、これらは度数分布表と呼ばれることがよくあります。 また、表には、データが中心傾向を持っているかどうかが示されている場合があります。これは、表の中央に集まったより高い周波数で視覚的に表すことができます。 また、すべてのクラスにわたるデータの分散を表示することもありますが、これは変動とも呼ばれます。