히스토그램 분포 란?
통계의 히스토그램 분포는 히스토그램에서 일 변량 데이터 막대의 패턴, 모양 및 위치를 나타냅니다. 막대가 분포 된 방법 및 위치를 사용하여 데이터에 대한 결론을 분석하고 결론을 도출 할 수 있습니다. 히스토그램 분포 분석은 데이터 정규성, 다중 모드 분포 및 기울어 진 데이터와 같은 특성을 식별하는 데 중요합니다.
히스토그램은 데이터의 특징을 시각적으로 보여주기 위해 영역 또는 클래스 주파수에 비례하여 사각형을 사용하는 일 변량 데이터 디스플레이입니다. 히스토그램의 데이터 포인트는 빈으로 구성되며 히스토그램 분포 자체는 데이터의 주파수 분포 또는 확률 밀도 함수의 시각적 근사치입니다. 분포의 모양은 구간 수에 따라 변경 될 수 있습니다.
히스토그램 분포 분석은 종종 데이터 정규성에 대한 정성 검사로 사용됩니다. 정규성을 결정하기위한 분석 방법이 있지만 히스토그램을 사용하여 시간을 절약하기위한 빠르고 상식적인 검사를 제공 할 수 있습니다. 히스토그램 데이터가 대략 균일하고 평균을 중심으로 표시되면 데이터는 정상적인 것으로 간주됩니다. 빠르고 비교적 쉬운 방법이지만, 이러한 종류의 정성 검사는 주관적이며 더 높은 정확도 표준이 필요한 경우 분석 방법을 사용해야합니다.
데이터 세트가 왜도를 나타내는 지 확인하는 것은 히스토그램 분포 분석을 사용할 수있는 또 다른 방법입니다. 데이터 왜도는 데이터에서 뚜렷한 비대칭으로 정의됩니다. 낮은 값을 가진 데이터 세트에서 음의 치우침 또는 왼쪽으로 치우침이 나타납니다. 양의 치우침 또는 오른쪽으로 치우침은 값이 거의없는 데이터 세트에서 발생합니다. 히스토그램 분포를 관찰하면 특이 치와 치우친 데이터가 드러날 수 있습니다.
단일 모드로 데이터의 특성을 밝히는 것 외에도 히스토그램의 모양은 멀티 모달 데이터의 특성을 나타낼 수 있습니다. 멀티 모달 데이터 세트에는 둘 이상의 모드가 포함되며 둘 이상의 피크 또는 최대 값을 갖는 주파수 분포가 특징입니다. 도시의 정치 제휴, 승인 여론 조사 및 꿀벌의 체적 크기는 여러 모달 일 수있는 데이터 세트의 예입니다. 히스토그램의 모양을 관찰하고 다중 모드 데이터에서 다양한 피크를 기록하면 연구원에게 단순한 일 변량 통계 계산보다 더 많은 통찰력을 제공 할 수 있습니다.
히스토그램 분석 및 데이터 분포는 선택한 빈 크기에 따라 크게 달라집니다. 실제로, 다른 빈 크기가 사용될 수 있지만, 관측 수의 제곱근을 취함으로써 빈 수를 추정 할 수있다. 예를 들어, 교사는 문자 등급을 반영하는 빈 크기를 선택하여 시험 성적을 분석하도록 선택할 수 있습니다.