Skip to main content

Что такое дисперсионный анализ?

При проведении исследований иногда возникает необходимость проанализировать данные, сравнивая более двух выборок или групп. Тип теста логической логики, дисперсионный анализ (ANOVA), позволяет исследовать несколько образцов одновременно, чтобы определить, существует ли существенная связь между ними. Рассуждение идентично t-тестам, только дисперсионный анализ включает независимые переменные двух или более выборок. Различия между образцами, а также различия в пределах одного образца определяется. ANOVA основывается на четырех допущениях: уровень измерения, метод выборки, распределение населения и однородность дисперсии.

Чтобы определить, являются ли различия значительными, ANOVA касается различий между выборками и внутри них, что называется дисперсией. ANOVA может выяснить, больше ли дисперсия между выборками по сравнению с дисперсией среди элементов выборки. Если это окажется правдой, то различия считаются значительными.

Проведение теста ANOVA предполагает принятие определенных допущений. Во-первых, используется метод независимой случайной выборки, и выбор членов выборки из одной популяции не влияет на выбор членов из более поздних групп. Зависимые переменные измеряются в основном на уровне отношения интервалов; однако можно применить дисперсионный анализ к измерениям на уровне порядкового номера. Можно предположить, что население нормально распределено, даже если это не поддается проверке, и различия населения одинаковы, что означает, что население является однородным.

Исследовательская гипотеза предполагает, что по крайней мере одно среднее значение отличается от других, но разные средние значения не идентифицируются как большие или меньшие. Предсказывается только тот факт, что разница существует. ANOVA проверяет нулевую гипотезу, что означает, что нет разницы между всеми средними значениями, так что A = B = C. Это требует установки альфа, ссылаясь на уровень вероятности, при котором нулевая гипотеза будет отклонена.

Коэффициент F - это тестовая статистика, используемая специально для анализа отклонений, поскольку показатель F показывает, где начинается область отклонения для нулевой гипотезы. Разработанная статистиком Рональдом Фишером, формула для F выглядит следующим образом: F = между оценкой дисперсии группы (MSB), деленной на оценку дисперсии внутри группы (MSW), так что F = MSB / MSW. Каждая из оценок дисперсии состоит из двух частей - суммы квадратов (SSB и SSW) и степеней свободы (df). Используя статистические таблицы для биологических, сельскохозяйственных и медицинских исследований , альфа может быть установлена ​​и основана на этом, и нулевая гипотеза о никакой разнице может быть отвергнута. Можно сделать вывод, что существует значительная разница между всеми группами, если это так.