Co to jest test nieparametryczny?
Test nieparametryczny jest rodzajem testowania hipotez statystycznych, który nie zakłada rozkładu normalnego. Z tego powodu testy nieparametryczne są czasami określane jako wolne od dystrybucji. Test nieparametryczny jest bardziej niezawodny niż test standardowy, generalnie wymaga mniejszych próbek, mniej prawdopodobne jest, że obserwacje będą miały na niego wpływ i można go zastosować przy mniejszej liczbie założeń. Z drugiej strony testy nieparametryczne mogą być mniej wydajne niż ich standardowe odpowiedniki, szczególnie jeśli populacja rzeczywiście jest normalnie rozmieszczona. Testy nieparametryczne są szczególnie skuteczne w przypadku pytań dotyczących częstotliwości i proporcji.
Standardowe testowanie hipotez porównuje próbkę z populacji testowej z próbką z populacji kontrolnej, aby ustalić, czy populacja testowa jest statystycznie porównywalna z populacją kontrolną. Jeżeli różnica między parametrem lub parametrami próbki - zwykle średnią i / lub wariancją - jest wystarczająco duża, wówczas próbkę testową można uznać za odrębną od populacji kontrolnej. Takie badanie parametryczne wymaga, aby parametry pochodziły z rozkładu normalnego.
Zostało matematycznie udowodnione, że próbka o wielkości 30 lub więcej będzie zachowywać się w przybliżeniu jak rozkład normalny, więc ogólnie jest to wymaganie. Jeśli założenie nie jest jednak uzasadnione, wyniki testów mogą być nieprawidłowe. Testy nieparametryczne pozwalają uniknąć tego założenia.
Zamiast tego, testowanie hipotez nieparametrycznych często bada dane albo przez ich kategoryzację, albo przez uporządkowanie. Jeśli populacje próbne i kontrolne są takie same i jeśli dane zostały zebrane poprawnie, wszelkie różnice między ich kategoriami lub rankingami są ściśle wynikiem przypadku. Jeśli prawdopodobieństwo, że różnice te mogły wystąpić przypadkowo, zwane również wartością P, jest mniejsze niż wybrane znaczące prawdopodobieństwo, zwykle 5 procent lub 1 procent, wówczas tester odrzuca hipotezę, że populacje próbki i populacji kontrolnej są to samo i stwierdza, że są różne.
Jednym z powszechnych testów nieparametrycznych jest test Chi-kwadrat, stosowany do porównywania obserwowanych częstotliwości lub proporcji. Gdy badany jest tylko jeden zestaw częstotliwości, jest to często nazywane testem dopasowania i służy do ustalenia, czy obserwowane częstotliwości mieszczą się w oczekiwanym zakresie. Na przykład można zastosować test dobroci dopasowania, aby ustalić, czy stół do ruletki został zmontowany, porównując wyniki stołu z wynikami przewidywanymi przez teorię prawdopodobieństwa lub aby ustalić, czy lek przeciwbólowy był skuteczny, porównując odsetek osób, u których ból głowy poprawił się w stosunku do leku u odsetka osób, u których ból głowy poprawił się po przyjęciu placebo. Jeśli zbadane są dwie częstotliwości, wówczas można zastosować test nieparametryczny Chi-kwadrat do zbadania korelacji lub niezależności między czynnikami. Ankieterzy polityczni często szukają korelacji między czynnikami społecznymi, ekonomicznymi lub demograficznymi a przekonaniami politycznymi, na przykład sprawdzając, czy istnieje korelacja między wykształceniem danej osoby i czy akceptuje ona wyniki pracy wybranego urzędnika.
Innym testem nieparametrycznym jest test sumy rang Wilcoxona, który zasadniczo stosuje się w tych samych sytuacjach, co standardowe testowanie hipotez parametrycznych. Jednak zamiast badać średnią każdej próbki, test Wilcoxona sprawdza rangę każdej wartości, jeśli dwie próbki są uporządkowane od najmniejszej do największej. Jeśli dwie próbki są takie same, każda grupa powinna być równomiernie rozrzucona w rankingu. Jeśli jedna grupa jest zgrupowana w dolnej lub górnej części rankingu, oznacza to, że dwie grupy są różne.
Załóżmy na przykład, że ktoś chciał ustalić, czy filmy animowane są dłuższe czy krótsze niż filmy nieanimowane. W przypadku standardowego testu ustaliłby średni czas trwania próby filmów animowanych i próbki filmów na żywo i porównał różnicę z wariancją próbek. W przypadku testu nieparametrycznego Wilcoxona czasy filmu są uporządkowane od najmniejszej do największej, a szeregi czasów filmu animowanego są sumowane.
Osoba może obliczyć prawdopodobieństwo, że suma rang byłaby tego rozmiaru lub mniejsza, określając liczbę możliwych porządków z daną sumą stopni i całkowitą liczbę możliwych porządków, obliczenie, które jest proste, biorąc pod uwagę wystarczającą siłę obliczeniową siły brutalnej. Z dwoma małymi próbkami po sześć filmów w każdym, istnieje już 924 możliwych układów rankingów, liczba ta szybko rośnie znacznie wraz z dodawaniem filmów. Alternatywnie istnieją opublikowane tabele, które podają prawdopodobieństwa odpowiadające danym sumom rang dla danej wielkości próby. Można je znaleźć w tekstach statystycznych lub w Internecie.
Badania nieparametryczne to coraz większa dziedzina. Można go zastosować w dowolnej dziedzinie, w której zastosowano również bardziej konwencjonalne statystyki. Zastosowania są jednak szczególnie powszechne w naukach społecznych i medycynie, zwłaszcza gdy nie można zastosować normalnej dystrybucji.