Co to jest test nieparametryczny?
Test nieparametryczny jest rodzajem testowania hipotez statystycznych, który nie zakłada rozkładu normalnego. Z tego powodu testy nieparametryczne są czasami określane jako wolne od dystrybucji. Test nieparametryczny jest bardziej niezawodny niż test standardowy, ogólnie wymaga mniejszych próbek, mniej prawdopodobne jest, aby naległy obserwacje i można go zastosować przy mniejszej liczbie założeń. Z drugiej strony testy nieparametryczne mogą być mniej wydajne niż ich standardowe odpowiedniki, szczególnie jeśli populacja naprawdę jest normalnie rozłożona. Testy nieparametryczne są szczególnie skuteczne w przypadku pytań dotyczących częstotliwości i proporcji.
Standardowe testy hipotezy porównuje próbkę z populacji testowej z próbką z populacji kontrolnej w celu ustalenia, czy populacja testowa jest statystycznie porównywalna z populacją kontrolną. Jeśli różnica między parametrem próbki lub parametrami - zwykle średnia i/lub wariancja - jest wystarczająco duża, toPróbkę testową można uznać za różniącą się od populacji kontrolnej. Takie testowanie parametryczne wymaga, aby parametry pochodziły z rozkładu normalnego.
Udowodniono matematycznie, że wielkość próby 30 lub więcej zachowa się w przybliżeniu jak rozkład normalny, więc ten wymóg jest ogólnie przyjmowany. Jeśli jednak założenie nie jest uzasadnione, wyniki testowania mogą nie być ważne. Testy nieparametryczne pozwalają uniknąć tego założenia.
Zamiast tego testowanie hipotez nieparametrycznych powszechnie analizuje dane, kategoryzując je lub zamawiając. Jeśli populacje próbek i kontroli są takie same i jeśli dane zostały zebrane prawidłowo, wszelkie różnice między ich kategoriami lub rankingami są ściśle wynikami przypadków. Gdyby prawdopodobieństwo, że różnice te mogłyby wystąpić przypadkowo, zwana również wartością p, jest mniejsza niż wybrany znaczący probabiliTy, zwykle 5 procent lub 1 procent, wówczas tester odrzuca hipotezę, że populacje próbki i kontroli są takie same i stwierdza, że są one różne.Jednym z powszechnych nieparametrycznych testów jest test chi-kwadrat, używany do porównania obserwowanych częstotliwości lub proporcji. Gdy badany jest tylko jeden zestaw częstotliwości, jest to często nazywane testem dobroci dopasowania i służy do ustalenia, czy obserwowane częstotliwości mieszczą się w zakresie, którego można się spodziewać. Na przykład test dobroci dopasowania można zastosować do ustalenia, czy tabela ruletki została sfałszowana poprzez porównanie wyników tabeli z wynikami, że teoria prawdopodobieństwa przewiduje lub do ustalenia, czy lekarstwo bólu głowy było skuteczne, porównując odsetek osób, których ból głowy poprawił się w leku do proporcji osób, których bólu głowy uległy poprawie, gdy poprawiły się, gdy poprawiły się placebo. Jeśli zbadane są dwie częstotliwości, wówczas test nieparametryczny chi-kwadrat może być użyty do testowania korelacji lub niezależnościmiędzy czynnikami. Pollsterzy polityczni często szukają korelacji między czynnikami społecznymi, ekonomicznymi lub demograficznymi a przekonaniami politycznymi, takich jak sprawdzenie, czy istnieje korelacja między wykształceniem danej osoby a tym, czy zatwierdzi ona, jak wykonuje wybrany urzędnik.
Kolejnym testem nieparametrycznym jest test sumy rankingu Wilcoxona, który jest ogólnie stosowany w tych samych sytuacjach jako standardowy test hipotez parametrycznych. Jednak zamiast badać średnią każdej próbki, test Wilcoxona analizuje rangę każdej wartości, jeśli dwie próbki są uporządkowane od najmniejszej do największej. Jeśli dwie próbki są takie same, każda grupa powinna być równomiernie rozproszona przez ranking. Jeśli jedna grupa jest skupiona na dolnym lub górnym końcu rankingu, oznacza to, że obie grupy są różne.
Na przykładZałóżmy, że ktoś chciał ustalić, czy filmy animowane są dłuższe, czy krótsze niż filmy nie animowane. W przypadku standardowego testu określiłbyŚredni czas trwania próbki filmów animowanych i próbki filmów na żywo i porównaj różnicę z wariancją próbek. W przypadku nieparametrycznego testu Wilcoxona czasy filmu są uporządkowane od najmniejszego do największego, a szeregi czasów filmów animowanych są sumowane.
Osoba może obliczyć prawdopodobieństwo, że sumą rang byłoby ten rozmiar lub mniejszy, określając liczbę możliwych zamówień z daną sumą rang i całkowitą liczbę możliwych uporządkowania, obliczenia, które jest proste, biorąc pod uwagę wystarczającą siłę obliczania siły brutalnej. Przy dwóch małych próbkach po sześciu filmach, istnieje już 924 możliwe ustalenia rankingów, liczba, która szybko rośnie w miarę dodawania filmów. Alternatywnie, istnieją opublikowane tabele, które dają prawdopodobieństwa odpowiadające podanym kwotom rang dla danych wielkości próbek. Można je znaleźć w tekstach statystycznych lub online.
Testy nieparametryczne są rosnącym polem. Można go zastosować w dowolnympole, w którym zastosowano również bardziej konwencjonalne statystyki. Zastosowania są szczególnie powszechne w naukach społecznych i medycynie, szczególnie gdy nie można zastosować normalnej dystrybucji.