Hvad er en ikke-parametrisk test?
En ikke-parametrisk test er en type statistisk hypotesetest, der ikke antager en normal fordeling. Af denne grund omtales ikke-parametriske tests undertiden som distribueringsfri. En ikke-parametrisk test er mere robust end en standardtest, kræver generelt mindre prøver, er mindre tilbøjelige til at blive påvirket af overliggende observationer og kan anvendes med færre antagelser. På den anden side kan ikke-parametriske test være mindre effektive end deres standardpartikler, især hvis befolkningen virkelig er fordelt. Ikke-parametrisk test er især effektiv til spørgsmål, der beskæftiger sig med frekvenser og proportioner.
Standardhypotesetest sammenligner en prøve fra en testpopulation med en prøve fra en kontrolpopulation for at bestemme, om testpopulationen er statistisk sammenlignelig med kontrolpopulationen. Hvis forskellen mellem prøveparameteren eller parametrene - normalt middelværdien og / eller variansen - er stor nok, kan testprøven vurderes at være forskellig fra kontrolpopulationen. Sådan parametrisk test kræver, at parametrene kommer fra en normal fordeling.
Det er matematisk bevist, at en prøvestørrelse på 30 eller mere vil opføre sig omtrent som en normal fordeling, så dette krav antages generelt. Hvis antagelsen ikke er berettiget, er resultaterne af testen muligvis ikke gyldige. Ikke-parametrisk test undgår denne antagelse.
I stedet undersøger ikke-parametrisk hypotesetest data ofte enten ved at kategorisere dem eller ved at bestille dem. Hvis prøven og kontrolpopulationerne er de samme, og hvis dataene blev indsamlet korrekt, er forskelle mellem deres kategorier eller placeringer strengt resultatet af tilfældighederne. Hvis sandsynligheden for, at disse forskelle kunne have forekommet ved tilfældig tilfældighed, også kaldet en P-værdi, er mindre end en valgt signifikant sandsynlighed, normalt enten 5 procent eller 1 procent, afviser testeren hypotesen om, at prøven og kontrolpopulationerne er det samme og konkluderer, at de er forskellige.
En almindelig ikke-parametrisk test er en Chi-square-test, der bruges til at sammenligne observerede frekvenser eller proportioner. Når kun et sæt frekvenser undersøges, kaldes dette ofte en goodness-of-fit-test og bruges til at bestemme, om de observerede frekvenser passer inden for det forventede interval. For eksempel kunne en god-af-fit-test bruges til at bestemme, om et roulette-bord var blevet rigget ved at sammenligne tabelresultater med de resultater, som sandsynlighedsteorien forudsiger, eller til at bestemme, om en hovedpine-medicin var effektiv ved at sammenligne andelen af mennesker, hvis hovedpine forbedrede medicinen til den andel af mennesker, hvis hovedpine blev bedre, når de tog placebo. Hvis to frekvenser undersøges, kan Chi-square nonparametric test bruges til at teste for sammenhæng eller uafhængighed mellem faktorer. Politiske pollstere ser ofte efter sammenhæng mellem sociale, økonomiske eller demografiske faktorer og politiske overbevisninger, såsom at se, om der er en sammenhæng mellem en persons uddannelse, og om han eller hun godkender, hvordan en valgt embedsmand klarer sig.
En anden ikke-parametrisk test er Wilcoxon rank sum test, som generelt bruges i de samme situationer som standard parametrisk hypotesetest. I stedet for at undersøge gennemsnittet af hver prøve, undersøger Wilcoxon-testen imidlertid rangeringen af hver værdi, hvis de to prøver bestilles fra mindst til størst. Hvis de to prøver er ens, skal hver gruppe spredes jævnt gennem rangeringen. Hvis en gruppe er samlet i den nedre eller øvre ende af rangeringen, indikerer dette, at de to grupper er forskellige.
Antag f.eks., At nogen ville afgøre, om animerede film er længere eller kortere end ikke-animerede film. Ved en standardtest bestemte vedkommende den gennemsnitlige varighed for en prøve animerede film og for en prøve live-action-film og sammenligner forskellen med variansen af prøverne. For Wilcoxon-ikke-parametriske test er filmtiderne sat i rækkefølge fra mindst til størst, og rækkerne for de animerede filmtider summeres.
Personen kunne beregne sandsynligheden for, at rangsummen ville være den størrelse eller mindre ved at bestemme antallet af mulige bestillinger med en given rangsum og det samlede antal mulige bestillinger, en beregning, der er enkel, idet der er beregnet styrke til beregning af brute-kraft. Med to små prøver på seks film hver er der allerede 924 mulige rangordninger, et tal, der hurtigt vokser meget større, når film tilføjes. Alternativt er der offentliggjorte tabeller, der giver sandsynligheder svarende til givne rangsummer for givne prøvestørrelser. Disse kan findes i statistiktekster eller online.
Ikke-parametrisk testning er et voksende felt. Det kan anvendes på ethvert felt, hvor der også er brugt mere konventionelle statistikker. Anvendelser er især almindelige inden for samfundsvidenskab og medicin, dog især når normal distribution ikke kan finde anvendelse.