Vad är ett icke-parametriskt test?
Ett icke-parametriskt test är en typ av statistisk hypotesundersökning som inte antar en normalfördelning. Av denna anledning benämns ibland icke-parametriska tester som distribueringsfria. Ett icke-parametriskt test är mer robust än ett standardtest, i allmänhet kräver mindre prover, är mindre troligt att påverkas av yttre observationer och kan tillämpas med färre antaganden. Å andra sidan kan icke-parametriska tester vara mindre effektiva än deras vanliga motsvarigheter, särskilt om befolkningen verkligen är fördelad. Nonparametrisk testning är särskilt effektiv för frågor som handlar om frekvenser och proportioner.
Standardhypotestning jämför ett prov från en testpopulation med ett prov från en kontrollpopulation för att bestämma om testpopulationen är statistiskt jämförbar med kontrollpopulationen. Om skillnaden mellan provparametern eller parametrarna - vanligtvis medelvärdet och / eller variansen - är tillräckligt stor, kan testprovet bedömas skilja sig från kontrollpopulationen. Sådan parametrisk testning kräver att parametrarna kommer från en normal distribution.
Det har matematiskt bevisats att en provstorlek på 30 eller mer kommer att uppträda ungefär som en normalfördelning, så detta krav antas i allmänhet. Om antagandet inte är motiverat kan resultaten av testningen emellertid inte vara giltiga. Icke-parametrisk testning undviker detta antagande.
Istället undersöker icke-parametrisk hypotesundersökning data antingen genom att kategorisera det eller genom att beställa dem. Om prov- och kontrollpopulationerna är desamma och om data samlades in korrekt, är skillnaderna mellan deras kategorier eller rangordningar strikt resultat av en slump. Om sannolikheten för att dessa skillnader skulle ha inträffat av slumpmässig chans, även kallad ett P-värde, är mindre än en vald signifikant sannolikhet, vanligtvis antingen 5 procent eller 1 procent, avvisar testaren hypotesen att prov- och kontrollpopulationer är samma och drar slutsatsen att de är olika.
Ett vanligt icke-parametriskt test är ett Chi-kvadrat-test, som används för att jämföra observerade frekvenser eller proportioner. När endast en uppsättning frekvenser undersöks, kallas detta ofta ett godhet-av-passningstest och används för att bestämma om de observerade frekvenserna passar inom det område som kan förväntas. Exempelvis kan ett test av godhet-av-fit användas för att bestämma om ett roulette bord hade riggats genom att jämföra tabellresultat med de resultat som sannolikhetsteorin förutspår eller för att bestämma om en huvudvärkmedicin var effektiv genom att jämföra andelen personer vars huvudvärk förbättrade medicinen till andelen människor vars huvudvärk förbättrades när de tog placebo. Om två frekvenser undersöks, kan Chi-kvadratiska icke-parametriska testet användas för att testa för korrelation eller oberoende mellan faktorer. Politiska pollsters letar ofta efter samband mellan sociala, ekonomiska eller demografiska faktorer och politiska övertygelser, som att se om det finns ett samband mellan en persons utbildning och om han eller hon godkänner hur en vald tjänsteman presterar.
Ett annat icke-parametriskt test är Wilcoxon rank sumtest, som vanligtvis används i samma situationer som standard parametrisk hypotest. Istället för att undersöka medelvärdet för varje prov, undersöker Wilcoxon-testet dock rankningen för varje värde om de två proverna beställs från minst till största. Om de två proverna är desamma, bör varje grupp spridas jämnt genom rankningen. Om en grupp grupperas i den nedre eller övre änden av rankningen, indikerar detta att de två grupperna är olika.
Anta till exempel att någon ville avgöra om animerade filmer är längre eller kortare än filmer som inte är animerade. För ett standardtest skulle han eller hon bestämma den genomsnittliga varaktigheten för ett prov av animerade filmer och för ett prov av live-actionfilmer och jämföra skillnaden med variansen för proverna. För Wilcoxon-icke-parametriska testet sätts filmtiderna i ordning från minst till största, och raderna för animerade filmtider summeras.
Personen kunde beräkna sannolikheten för att rangsumman skulle vara den storleken eller mindre genom att bestämma antalet möjliga beställningar med en given rangsumma och det totala antalet möjliga beställningar, en beräkning som är enkel med tillräckligt med beräkningsstyrkan för brute force. Med två små prover på sex filmer vardera finns det redan 924 möjliga rangordningar, ett nummer som snabbt växer mycket större när filmer läggs till. Alternativt finns det publicerade tabeller som ger sannolikheter motsvarande givna rangsumma för givna provstorlekar. Dessa finns i statistiktexter eller online.
Nonparametrisk testning är ett växande område. Det kan tillämpas inom alla områden där också mer konventionell statistik har använts. Ansökningar är särskilt vanliga inom samhällsvetenskap och medicin, dock särskilt när normal distribution inte kan gälla.