분산 분석이란 무엇입니까?
연구를 수행 할 때 때로는 두 개 이상의 샘플 또는 그룹을 비교하는 데이터를 분석해야 할 필요가 있습니다. 추론 통계 테스트의 유형 인 분산 분석 (ANOVA)은 중요한 표본 관계가 존재하는지 여부를 결정하기 위해 여러 샘플을 동시에 검사 할 수 있습니다. 추론은 t- 검정과 동일하며 분산 분석에만 두 개 이상의 표본에 대한 독립 변수가 포함됩니다. 한 샘플 내의 차이뿐만 아니라 샘플 간의 차이가 결정됩니다. 분산 분석은 측정 수준, 샘플링 방법, 모집단 분포 및 분산의 동질성이라는 네 가지 가정을 기반으로합니다.
차이가 유의한지 여부를 확인하기 위해 ANOVA는 샘플 간의 차이와 샘플 간의 차이를 고려합니다.이를 분산이라고합니다. 분산 분석은 샘플 멤버 간의 분산과 비교하여 샘플 간의 분산이 더 큰지 알 수 있습니다. 이것이 사실 인 것으로 판명되면, 그 차이는 중요한 것으로 간주됩니다.
분산 분석 테스트를 수행하려면 특정 가정을 수용해야합니다. 첫 번째는 독립적 인 랜덤 샘플링 방법이 사용되고 단일 모집단에서 표본 구성원을 선택해도 이후 집단에서 구성원을 선택하는 데 영향을 미치지 않습니다. 종속 변수는 주로 간격 비율 수준에서 측정됩니다. 그러나 분산 분석을 순서 수준 측정에 적용 할 수 있습니다. 검증 할 수 없지만 모집단 분산이 동일하더라도 모집단이 정규 분포되어 있다고 가정 할 수 있습니다. 이는 모집단이 균질하다는 것을 의미합니다.
연구 가설은 하나 이상의 평균이 다른 평균과 다르다고 가정하지만, 다른 평균은 더 크거나 작은 것으로 식별되지 않습니다. 차이가 존재한다는 사실 만 예측됩니다. ANOVA는 귀무 가설을 검정합니다. 즉, A = B = C와 같이 모든 평균 값간에 차이가 없습니다. 이는 귀무 가설이 기각 될 확률 수준을 참조하여 알파를 설정해야합니다.
F 점수는 귀무 가설에 대한 기각 영역이 시작되는 위치를 보여 주므로 분산 분석에 특별히 사용되는 검정 통계량입니다. 통계 학자 Ronald Fisher가 개발 한 F 공식은 다음과 같습니다. F = 그룹 분산 추정치 (MSB)를 그룹 분산 추정치 (MSW)로 나눈 값 (F = MSB / MSW). 각 분산 추정값은 두 제곱의 합 (SSB 및 SSW)과 자유도 (df)로 구성됩니다. 생물학적, 농업 및 의학 연구에 대한 통계표를 사용하여 알파를 설정하고이를 기반으로 할 수 있으며, 차이에 대한 귀무 가설을 기각 할 수 있습니다. 이 경우 모든 그룹간에 상당한 차이가 있다고 결론 지을 수 있습니다.