Наука

Что такое непараметрический тест?

Непараметрический тест - это тип проверки статистической гипотезы, который не предполагает нормального распределения. По этой причине непараметрические тесты иногда называют бесплатными. Непараметрический критерий является более надежным, чем стандартный критерий, обычно требует меньших выборок, менее подвержен влиянию внешних наблюдений и может применяться с меньшим количеством допущений. С другой стороны, непараметрические тесты могут быть менее эффективными, чем их стандартные аналоги, особенно если популяция действительно распределена нормально. Непараметрическое тестирование особенно эффективно для вопросов, касающихся частот и пропорций.

Стандартное тестирование гипотез сравнивает выборку из тестовой популяции с выборкой из контрольной популяции, чтобы определить, является ли тестовая популяция статистически сопоставимой с контрольной популяцией. Если разница между параметром выборки или параметрами - обычно средним значением и / или дисперсией - достаточно велика, то можно считать, что тестовая выборка отличается от контрольной популяции. Такое параметрическое тестирование требует, чтобы параметры исходили из нормального распределения.

Математически доказано, что размер выборки 30 или более будет вести себя примерно как нормальное распределение, поэтому это требование обычно принимается. Однако, если предположение не обосновано, результаты тестирования могут быть недействительными. Непараметрическое тестирование позволяет избежать этого предположения.

Вместо этого непараметрическое тестирование гипотез обычно проверяет данные либо путем их категоризации, либо путем упорядочения. Если выборка и контрольные популяции одинаковы и если данные были собраны правильно, любые различия между их категориями или рейтингами являются исключительно случайными результатами. Если вероятность того, что эти различия могли произойти случайно, также называемая P-значением, меньше выбранной значимой вероятности, обычно 5% или 1%, тогда тестер отвергает гипотезу о том, что выборка и контрольные популяции являются То же самое и делает вывод, что они разные.

Одним из распространенных непараметрических критериев является критерий хи-квадрат, используемый для сравнения наблюдаемых частот или пропорций. Когда проверяется только один набор частот, его часто называют проверкой на пригодность и используют для определения того, соответствуют ли наблюдаемые частоты в пределах ожидаемого диапазона. Например, тест на пригодность можно использовать для определения того, была ли сфальсифицирована таблица рулетки, путем сравнения результатов таблицы с результатами, предсказываемыми теорией вероятностей, или для определения эффективности лекарств от головной боли, сравнивая долю людей с головной болью. улучшение в медицине в пропорции людей, головная боль которых улучшилась, когда они приняли плацебо. Если исследуются две частоты, то непараметрический критерий хи-квадрат можно использовать для проверки корреляции или независимости между факторами. Политические социологи часто ищут корреляцию между социальными, экономическими или демографическими факторами и политическими убеждениями, такими как выяснение, есть ли корреляция между образованием человека и одобряет ли он или она то, как действует выборное должностное лицо.

Другим непараметрическим тестом является критерий суммы рангов Уилкоксона, который обычно используется в тех же ситуациях, что и стандартное параметрическое тестирование гипотез. Однако вместо проверки среднего значения каждой выборки критерий Уилкоксона проверяет ранг каждого значения, если две выборки упорядочены от наименьшего к наибольшему. Если две выборки одинаковы, каждая группа должна быть равномерно распределена по рейтингу. Если одна группа сгруппирована в нижней или верхней части рейтинга, это означает, что две группы различны.

Например, предположим, что кто-то хотел определить, являются ли анимационные фильмы длиннее или короче, чем не анимационные фильмы. Для стандартного теста он или она будет определять среднюю продолжительность для образца анимационных фильмов и для образца фильмов с живым действием и сравнивать разницу с дисперсией выборок. Для непараметрического критерия Уилкоксона времена фильмов располагаются в порядке от наименьшего к наибольшему, а ранги времен анимационных фильмов суммируются.

Человек может рассчитать вероятность того, что сумма ранга будет такого же или меньшего размера, определив число возможных упорядочений с заданной суммой рангов и общее число возможных упорядочений, что является простым вычислением с учетом достаточной силы вычисления грубой силы. С двумя небольшими выборками по шесть фильмов в каждом уже есть 924 возможных порядка ранжирования, число которых быстро увеличивается по мере добавления фильмов. Кроме того, существуют опубликованные таблицы, которые дают вероятности, соответствующие данным ранговых сумм для данных размеров выборки. Их можно найти в статистических текстах или в Интернете.

Непараметрическое тестирование является растущей областью. Он может применяться в любой области, в которой также используются более традиционные статистические данные. Однако приложения особенно распространены в социальных науках и медицине, особенно когда нормальное распределение не может быть применено.