Hva er en ikke-parametrisk test?

En ikke-parametrisk test er en type statistisk hypotetesting som ikke antar normalfordeling. Av denne grunn blir ikke-parametriske tester noen ganger referert til som distribusjonsfrie. En ikke-parametrisk test er mer robust enn en standard test, krever vanligvis mindre prøver, er mindre sannsynlig å bli påvirket av ytre observasjoner og kan brukes med færre antakelser. På den annen side kan ikke-parametriske tester være mindre effektive enn deres standard kolleger, spesielt hvis befolkningen virkelig er fordelt. Ikke-parametrisk testing er spesielt effektiv for spørsmål som omhandler frekvenser og proporsjoner.

Standard hypotesetesting sammenligner et utvalg fra en testpopulasjon til en prøve fra en kontrollpopulasjon for å bestemme om testpopulasjonen er statistisk sammenlignbar med kontrollpopulasjonen. Hvis forskjellen mellom prøveparameteren eller parametrene - vanligvis gjennomsnittet og / eller variansen - er stor nok, kan testprøven vurderes å være forskjellig fra kontrollpopulasjonen. Slik parametrisk testing krever at parametrene kommer fra en normal fordeling.

Det er matematisk bevist at en prøvestørrelse på 30 eller mer vil oppføre seg omtrent som en normalfordeling, så dette antas generelt. Hvis antakelsen ikke er berettiget, er imidlertid resultatene av testen ikke gyldige. Ikke-parametrisk testing unngår denne antagelsen.

I stedet undersøker ofte ikke-parametrisk hypotesetesting data enten ved å kategorisere det eller ved å bestille det. Hvis utvalg- og kontrollpopulasjonene er de samme, og hvis dataene ble samlet riktig, er ulikheter mellom deres kategorier eller rangeringer strengt tatt resultatene av tilfeldigheter. Hvis sannsynligheten for at disse forskjellene kunne ha skjedd ved en tilfeldig tilfeldighet, også kalt en P-verdi, er mindre enn en valgt betydelig sannsynlighet, vanligvis enten 5 prosent eller 1 prosent, avviser testeren hypotesen om at utvalget og kontrollpopulasjonene er samme og konkluderer med at de er forskjellige.

En vanlig ikke-parametrisk test er en Chi-kvadrat-test som brukes til å sammenligne observerte frekvenser eller proporsjoner. Når bare ett sett med frekvenser blir undersøkt, kalles dette ofte en godhet-av-fit-test og brukes til å bestemme om de observerte frekvensene passer innenfor det området som kan forventes. For eksempel kunne en godkjennelsestest brukes til å bestemme om et rulettbord hadde blitt rigget ved å sammenligne tabellresultater med resultatene som sannsynlighetsteorien forutsier eller for å bestemme om en hodepinemedisin var effektiv ved å sammenligne andelen mennesker som hadde hodepine forbedret medisinen til andelen av mennesker hvis hodepine ble bedre når de tok placebo. Hvis to frekvenser undersøkes, kan Chi-square nonparametric test brukes til å teste for korrelasjon eller uavhengighet mellom faktorer. Politiske pollstere ser ofte etter sammenheng mellom sosiale, økonomiske eller demografiske faktorer og politiske overbevisninger, for eksempel å se om det er en sammenheng mellom en persons utdanning og om han eller hun godkjenner hvordan en valgt tjenestemann presterer.

En annen ikke-parametrisk test er Wilcoxon rang sumtest, som vanligvis brukes i de samme situasjonene som standard parametrisk hypotetesting. I stedet for å undersøke gjennomsnittet av hver prøve, undersøker imidlertid Wilcoxon-testen rangering av hver verdi hvis de to prøvene blir bestilt fra minst til størst. Hvis de to prøvene er de samme, bør hver gruppe spres jevnt gjennom rangeringen. Hvis en gruppe er gruppert i nedre eller øvre ende av rangeringen, indikerer dette at de to gruppene er forskjellige.

Anta for eksempel at noen ønsket å avgjøre om animerte filmer er lengre eller kortere enn ikke-animerte filmer. For en standardtest vil vedkommende bestemme gjennomsnittlig varighet for et utvalg av animerte filmer og for et utvalg live-action-filmer og sammenligne forskjellen med variansen til prøvene. For Wilcoxon-ikke-parametriske testen settes filmtidene i rekkefølge fra minst til størst, og rekkene av animerte filmtider summeres.

Personen kunne beregne sannsynligheten for at rangeringssummen ville være den størrelsen eller mindre ved å bestemme antall mulige bestillinger med en gitt rangeringssum og det totale antall mulige bestillinger, en beregning som er enkel gitt nok beregningsstyrke for brute force. Med to små prøver på seks filmer hver, er det allerede 924 mulige rangeringer av rangeringer, et tall som raskt blir mye større etter hvert som filmer legges til. Alternativt er det publiserte tabeller som gir sannsynligheter som tilsvarer gitte rangeringssummer for gitte utvalgsstørrelser. Disse finner du i statistikktekster eller online.

Nonparametrisk testing er et voksende felt. Det kan brukes på et hvilket som helst felt der det også er brukt mer konvensjonell statistikk. Søknader er spesielt vanlige innen samfunnsvitenskap og medisin, men særlig når normalfordeling ikke kan gjelde.

ANDRE SPRÅK

Hjalp denne artikkelen deg? Takk for tilbakemeldingen Takk for tilbakemeldingen

Hvordan kan vi hjelpe? Hvordan kan vi hjelpe?