ボックスプロットとは

箱ひげ図または箱ひげ図は、単一の数値線に沿って数値データを整理する方法であり、水平または垂直のいずれかです。 実際のボックスは、プロットが水平の場合、数値の線よりわずかに上にあり、3本の垂直線で構成され、水平線で接続されています。 ボックスの水平方向の境界は、データの中央値または50パーセンタイルである中央線で区切られた、1番目と3番目の四分位(25パーセンタイルと75パーセンタイル)を表します。 水平線の中央からボックスプロットの両側に、ウィスカーとも呼ばれる垂直線が伸びています。 これらがデータセットの最小および最大数に達すると、それらはより小さな水平線で終わりますが、これはデータの広がりによってわずかに異なる場合があります。

良い箱ひげ図を構成するいくつかの重要な要素と、これらのグラフを作成するときに知っておく必要があるいくつかの数値があります。 これらの最初のものは5つの数字の要約と呼ばれ、しばしば5つの数字と略されます。 和。 これは、1番目と3番目の四分位数、中央値、およびデータの最小数と最大数のリストです。 いくつかのアプリケーションでは、人々はプロットの近くにこれらをリストする必要がありますが、3本の水平線と終了ウィスカーを見ることで、適切な数直線のプロットの分析もこれらの数を導き出すことができます。 5 numなので、プロットを描く人にとっては鶏/卵の質問ではありません。 和。 プロットの作成に使用する必要があります。

人々は、四分位範囲(IQR)と呼ばれる数値も知る必要があります。 最初の四分位数を3番目の四分位数から引くと、IQRが導出されます。また、異なるソフトウェアまたは科学計算機を使用して、すべてのデータを入力することでこの数と5つの数の要約を取得できます。 通常、ボックスから伸びる線はIQRの1.5倍までしか伸びないため、IQRは重要です。 そのポイントを超えるデータは、連続線ではなく点で示されます。 これらの点は、多くの場合、データに外れ値があることを示しています。

ボックスプロットにはさまざまな用途があります。 1つの数値線の上に複数のプロットを描くことができ、いくつかの重要な要因で区別された同様のデータセットを比較できます。 たとえば、科学者または統計学者は、男性と女性の心拍数を記録し、2つの積み上げボックスプロットを作成して、範囲と四分位数の有意差を探します。

ボックスプロットは、データの頻度に対応しません。 追加のスケール(垂直または水平)がないため、繰り返し数値、データセットサイズ、およびほとんどの個々の数値に関する情報が省略されます。 ボックスプロットを見ている人は、5つの数値の要約、範囲、およびデータに異常値があるかどうかを最もよく理解します。 ボックスサイズ、中央値と四分位数の関係、およびひげの長さは、データが歪んでいるかどうかを示すことができますが、平均、モード、標準偏差などとは言えません。 ヒストグラムなどの他のグラフは、頻度などを表現したい場合や、データの分布に関するより良い視覚効果を得たい場合に便利です。

他の言語

この記事は参考になりましたか? フィードバックをお寄せいただきありがとうございます フィードバックをお寄せいただきありがとうございます

どのように我々は助けることができます? どのように我々は助けることができます?