상자 그림이란 무엇입니까?

박스 플롯 또는 박스 앤 위스커 다이어그램은 단일 숫자 라인을 따라 숫자 데이터를 구성하는 방법으로 수평 또는 수직 일 수 있습니다. 플롯이 수 평일 때 실제 상자는 숫자 선 위에 약간 위치하며 수평선으로 함께 연결된 세 개의 수직선으로 구성됩니다. 상자의 가로 경계는 데이터의 중앙값 또는 50 번째 백분위 수 인 중간 선으로 구분 된 첫 번째 및 세 번째 사 분위수 (25 번째 및 75 번째 백분위 수)를 나타냅니다. 수평선의 중간에서 상자의 양쪽에 플롯, 때로는 수염이라고 불리는 수직선이 연장됩니다. 데이터 세트의 최소 및 최대 수에 도달하면 더 작은 수평선으로 끝나지만 데이터 스프레드에 따라 약간 다를 수 있습니다.

좋은 상자 그림을 구성하는 중요한 요소와 사람들이 차트를 만들 때 알아야 할 숫자가 있습니다. 이 중 첫 번째는 5 개의 숫자 요약이라고하며 종종 5 개의 숫자로 약칭됩니다. 합집합. 1 분위와 3 분위, 중간, 최소 및 최대 데이터 수의 목록입니다. 일부 응용 프로그램에서는 사람들이 플롯 근처에 이것을 나열해야하지만, 좋은 수의 라인이있는 플롯을 분석하면 세 개의 수평선과 끝 수염을 보면 이러한 숫자를 도출 할 수 있습니다. 숫자가 5 개이기 때문에 줄거리를 그리는 사람에게는 닭 / 계란 질문이 아닙니다. 합집합. 플롯을 생성하는 데 사용해야합니다.

또한 사 분위수 범위 (IQR)라고하는 숫자를 알아야합니다. 세 번째 사분 위에서 첫 번째 사 분위수를 빼면 IQR이 도출되며 다른 소프트웨어 또는 과학적 계산기를 사용하여 모든 데이터를 입력하여이 숫자와 다섯 개의 숫자 요약을 얻을 수도 있습니다. 상자에서 연장되는 선은 일반적으로 IQR의 1.5 배까지만 연장되므로 IQR이 중요합니다. 해당 지점 이후의 데이터는 연속 선 대신 점으로 표시됩니다. 이 점들은 종종 데이터에 특이 치가 있음을 나타냅니다.

박스 플롯에는 다양한 용도가 있습니다. 하나의 수선 위에 여러 도표를 그릴 수 있으며 중요한 요소로 구분 된 유사한 데이터 세트를 비교할 수 있습니다. 예를 들어, 과학자 또는 통계학자는 남녀의 심박수를 기록한 다음 범위와 사 분위수의 유의미한 차이를 찾기 위해 두 개의 누적 상자 그림을 구성 할 수 있습니다.

상자 그림은 데이터 빈도를 다루지 않습니다. 추가 스케일 (수직 또는 수평)이 없으면 반복되는 숫자, 데이터 세트 크기 및 대부분의 개별 숫자에 대한 정보가 생략됩니다. 상자 그림을보고있는 사람은 5 개의 숫자 요약, 범위 및 데이터에 특이 치가 있는지 여부를 가장 잘 이해합니다. 상자 크기, 중앙값과 사 분위수의 관계 및 수염 길이는 데이터가 왜곡되는지 여부를 표시 할 수 있지만 평균, 모드 또는 표준 편차와 같은 것은 말할 수 없습니다. 히스토그램과 같은 다른 차트는 사람들이 빈도와 같은 것을 나타내거나 데이터 배포에 대한 더 나은 시각적 자료를 도출하고자 할 때 더 유용 할 수 있습니다.

다른 언어

이 문서가 도움이 되었나요? 피드백 감사드립니다 피드백 감사드립니다

어떻게 도와 드릴까요? 어떻게 도와 드릴까요?