Co je neparametrický test?
Neparametrický test je typ statistického testování hypotéz, který nepředpokládá normální rozdělení. Z tohoto důvodu jsou neparametrické testy někdy označovány jako distribuce bez distribuce. Neparametrický test je robustnější než standardní test, obvykle vyžaduje menší vzorky, je méně pravděpodobný, že bude ovlivněn odlehlými pozorováními a může být použit s menším počtem předpokladů. Na druhé straně mohou být neparametrické testy méně účinné než jejich standardní protějšky, zejména pokud je populace skutečně distribuována. Neparametrické testování je zvláště efektivní u otázek týkajících se frekvencí a proporcí.
Standardní testování hypotéz porovnává vzorek z testované populace se vzorkem z kontrolní populace, aby se určilo, zda je testovaná populace statisticky srovnatelná s kontrolní populací. Pokud je rozdíl mezi parametrem nebo parametry vzorku - obvykle průměrem a / nebo rozptylem - dostatečně velký, lze zkušební vzorek považovat za odlišný od kontrolní populace. Takové parametrické testování vyžaduje, aby parametry pocházely z normálního rozdělení.
Bylo matematicky prokázáno, že velikost vzorku 30 nebo více se bude chovat přibližně jako normální rozdělení, takže se tento požadavek obecně předpokládá. Pokud však není předpoklad opodstatněný, nemusí být výsledky testování platné. Tento předpoklad se vyhýbá neparametrickému testování.
Místo toho neparametrické testování hypotéz obvykle zkoumá data buď jejich kategorizací, nebo objednáním. Pokud jsou vzorky a kontrolní populace stejné a pokud byla data shromážděna správně, jsou rozdíly mezi jejich kategoriemi nebo žebříčky přísně výsledkem náhody. Je-li pravděpodobnost, že by se tyto rozdíly mohly vyskytnout náhodnou náhodou, také nazývanou P-hodnota, menší než zvolená významná pravděpodobnost, obvykle buď 5 procent nebo 1 procenta, pak tester odmítne hypotézu, že populace vzorku a kontrolní skupiny jsou a dochází k závěru, že jsou odlišné.
Jedním běžným neparametrickým testem je Chi-kvadrátový test, který se používá k porovnání pozorovaných frekvencí nebo proporcí. Když je zkoumána pouze jedna sada frekvencí, je to často nazýváno testem shody a používá se k určení, zda pozorované frekvence zapadají do rozsahu, který by se očekával. Například test dobré shody by mohl být použit k určení, zda byl ruletový stůl zmanipulován porovnáním výsledků s výsledky, které teorie teorie pravděpodobnosti předpovídá, nebo k určení, zda byl lék na bolest hlavy účinný porovnáním podílu lidí, jejichž bolesti hlavy se zlepšil v léku na podíl lidí, jejichž bolesti hlavy se zlepšily, když užívali placebo. Jsou-li zkoumány dvě frekvence, pak lze pro testování korelace nebo nezávislosti mezi faktory použít Chi-kvádrový neparametrický test. Političtí znečišťovatelé často hledají korelaci mezi sociálními, ekonomickými nebo demografickými faktory a politickými přesvědčeními, jako například to, zda existuje korelace mezi vzděláním osoby a zda schvaluje, jak funguje zvolený úředník.
Dalším neparametrickým testem je Wilcoxonův součet, který se obvykle používá ve stejných situacích jako standardní parametrické testování hypotéz. Namísto zkoumání průměru každého vzorku však Wilcoxonův test zkoumá pořadí každé hodnoty, pokud jsou dva vzorky uspořádány od nejnižší k nejvyšší. Pokud jsou tyto dva vzorky stejné, měla by být každá skupina rozptýlena rovnoměrně pořadím. Pokud je jedna skupina seskupena na spodním nebo horním konci žebříčku, znamená to, že obě skupiny jsou odlišné.
Předpokládejme například, že někdo chtěl určit, zda jsou animované filmy delší nebo kratší než animované filmy. Pro standardní test by určil průměrnou dobu trvání pro vzorek animovaných filmů a pro vzorek živých filmů a porovnal rozdíl s rozptylem vzorků. U Wilcoxonova neparametrického testu jsou filmové časy seřazeny od nejnižšího k největšímu a sčítají se časy animovaného filmu.
Osoba by mohla spočítat pravděpodobnost, že hodnostní součet bude tou velikostí nebo menší, stanovením počtu možných objednávek s danou hodnostní součtem a celkovým počtem možných objednávek, což je výpočet, který je jednoduchý při dostatečné síle výpočtu brutto síly. Se dvěma malými ukázkami po šesti filmech existuje již 924 možných uspořádání pořadí, což je číslo, které se přidáváním filmů rychle zvyšuje. Alternativně jsou publikovány tabulky, které uvádějí pravděpodobnosti odpovídající daným součtovým součtem pro dané velikosti vzorků. Najdete je ve statistických textech nebo online.
Neparametrické testování je rostoucí pole. Může být použit v jakékoli oblasti, ve které byly použity i konvenční statistiky. Aplikace jsou zvláště běžné v sociálních vědách a medicíně, zejména pokud nelze použít normální rozdělení.