박스 플롯이란 무엇입니까?

박스 플롯 또는 박스 및 창고 다이어그램은 단일 숫자 라인을 따라 숫자 데이터를 구성하는 방법이며, 이는 수평 또는 수직 일 수 있습니다. 플롯이 수평 일 때 실제 상자는 숫자 선보다 약간 높으며 수평선으로 서로 연결된 3 개의 수직선으로 구성됩니다. 박스의 수평 경계는 데이터의 중앙값 또는 50 번째 백분위 수인 중간 라인으로 분리 된 첫 번째 및 세 번째 사 분위수 (25 번째 및 75 번째 백분위 수)를 나타냅니다. 상자의 양쪽에서 수평선 중간에서 플롯, 때로는 수염이라고 불리는 수직선이 확장됩니다. 이들이 데이터 세트의 최소 및 최대 수에 도달하면 더 작은 수평선으로 끝나지 만 데이터 스프레드에 따라 약간 다를 수 있습니다.

좋은 박스 플롯을 구성하는 몇 가지 중요한 요소와 사람들 이이 차트를 만들 때 알아야 할 숫자가 있습니다. 이 중 첫 번째는 5 개의 숫자 요약이라고하며 종종S 5 Num. 합집합. 이것은 첫 번째 및 세 번째 사 분위수, 중앙값 및 최소 및 최대 데이터의 목록입니다. 일부 응용 프로그램에서는 사람들이 플롯 근처에 이들을 나열해야하지만, 좋은 숫자 라인을 가진 플롯의 분석은 또한 세 가지 수평선과 엔딩 휘 스커를 보면서이 숫자를 도출 할 수 있습니다. 5 명이 줄거리를 그린 사람에게는 닭고기/달걀 질문이 아닙니다. 합집합. 줄거리를 만드는 데 사용해야합니다.

사람들은 또한 사 분위수 (IQR)라는 숫자를 알아야합니다. 세 번째 사 분위수에서 첫 번째 사 분위수를 빼면 IQR이 도출되며, 다른 소프트웨어 또는 과학적 계산기를 사용하면 모든 데이터를 입력 하여이 숫자와 5 개의 숫자 요약을 얻을 수 있습니다. 상자에서 연장되는 선은 일반적으로 IQR의 1.5 배까지 확장되므로 IQR은 중요합니다. 그 지점 이외의 데이터는 연속 대신 점으로 표시됩니다.선. 이 점들은 종종 데이터에 이상치가 있다고 제안합니다.

박스 플롯에는 다양한 용도가 있습니다. 몇 가지 플롯은 하나의 숫자 라인 이상으로 그려 질 수 있으며 중요한 요소로 구분 된 유사한 데이터 세트를 비교할 수 있습니다. 예를 들어, 과학자 나 통계 학자는 남성과 여성의 심박수를 기록한 다음 두 개의 쌓인 박스 플롯을 구성하여 범위와 사 분위수의 상당한 차이를 찾을 수 있습니다.

박스 플롯은 데이터 빈도를 다루지 않습니다. 추가 척도 (수직 또는 수평)의 부족은 반복 숫자, 데이터 세트 크기 및 대부분의 개별 숫자에 대한 정보를 생략합니다. 박스 플롯을보고있는 사람은 5 개의 숫자 요약, 범위 및 데이터에 이상치가 있는지 여부를 가장 많이 이해합니다. 상자 크기, 중앙값과 사 분위수 및 수염 길이는 데이터가 왜곡되었는지 여부를 보여줄 수 있지만 평균, 모드 또는 표준 편차와 같은 것과는 말할 수 없습니다. 히스토그램과 같은 다른 차트는 사람들이 다음과 같은 것을 나타내기를 원할 때 더 유용 할 수 있습니다.데이터 배포에 대한 빈도 또는 더 나은 시각을 도출합니다.

다른 언어

이 문서가 도움이 되었나요? 피드백 감사드립니다 피드백 감사드립니다

어떻게 도와 드릴까요? 어떻게 도와 드릴까요?