Hva er en ikke -parametrisk test?

En ikke -parametrisk test er en type statistisk hypotesetesting som ikke antar en normalfordeling. Av denne grunn blir ikke-parametriske tester noen ganger referert til som distribusjonsfrie. En ikke -parametrisk test er mer robust enn en standardtest, krever generelt mindre prøver, er mindre sannsynlig å bli påvirket av utliggende observasjoner og kan brukes med færre forutsetninger. På den annen side kan ikke -parametriske tester være mindre effektive enn deres standard kolleger, spesielt hvis befolkningen virkelig er distribuert. Ikke -parametrisk testing er spesielt effektivt for spørsmål som omhandler frekvenser og proporsjoner.

Standard hypotesetesting sammenligner en prøve fra en testpopulasjon med en prøve fra en kontrollpopulasjon for å bestemme om testpopulasjonen er statistisk sammenlignbar med kontrollpopulasjonen. Hvis forskjellen mellom prøveparameteren eller parametrene - vanligvis er middelet og/eller variansen - stor nok, så erTestprøve kan vurderes å være forskjellig fra kontrollpopulasjonen. Slik parametrisk testing krever at parametrene kommer fra en normalfordeling.

Det har blitt matematisk bevist at en prøvestørrelse på 30 eller flere vil oppføre seg omtrent som en normalfordeling, så dette kravet antas generelt. Hvis forutsetningen ikke er berettiget, kan det hende at resultatene av testingen ikke er gyldige. Ikke -parametrisk testing unngår denne antagelsen.

I stedet undersøker ikke -parametrisk hypotesetesting ofte data enten ved å kategorisere dem eller ved å bestille dem. Hvis utvalget og kontrollpopulasjonene er de samme, og hvis dataene ble samlet riktig, er noen forskjeller mellom kategoriene eller rangeringene strengt tatt resultatene av tilfeldighetene. Hvis sannsynligheten for at disse forskjellene kunne ha skjedd ved tilfeldig sjanse, også kalt en p-verdi, er mindre enn en valgt betydelig probability, vanligvis enten 5 prosent eller 1 prosent, deretter avviser testeren hypotesen om at prøven og kontrollpopulasjonene er de samme og konkluderer med at de er forskjellige.

En vanlig ikke-parametrisk test er en chi-kvadrat-test, brukt for å sammenligne observerte frekvenser eller proporsjoner. Når bare ett sett med frekvenser blir undersøkt, kalles dette ofte en godhetstest og brukes til å bestemme om de observerte frekvensene passer innenfor området som kan forventes. For eksempel kan en godhet-av-fit-test brukes til å bestemme om en roulettebord hadde blitt rigget ved å sammenligne tabellresultater med resultatene som sannsynlighetsteorien forutsier eller for å bestemme om en hodepine medisin var effektiv ved å sammenligne andelen mennesker hvis hodepine forbedret medisinen til andelen mennesker hvis hodepine ble bedre når de tok en placebo. Hvis to frekvenser blir undersøkt, kan den ikke-parametriske testen brukes til å teste for korrelasjon eller uavhengighetmellom faktorer. Politiske pollstere ser ofte etter sammenheng mellom sosiale, økonomiske eller demografiske faktorer og politisk tro, for eksempel å se om det er en sammenheng mellom en persons utdanning og om han eller hun godkjenner hvordan en valgt tjenestemann presterer.

En annen ikke -parametrisk test er Wilcoxon Rank sum -testen, som vanligvis brukes i de samme situasjonene som standard parametrisk hypotetesting. I stedet for å undersøke gjennomsnittet av hver prøve, undersøker imidlertid Wilcoxon -testen rangering av hver verdi hvis de to prøvene er bestilt fra minst til størst. Hvis de to prøvene er de samme, bør hver gruppe spredes jevnt gjennom rangeringen. Hvis en gruppe er gruppert i den nedre eller øvre enden av rangeringen, indikerer dette at de to gruppene er forskjellige.

Anta for eksempel at noen ønsket å avgjøre om animerte filmer er lengre eller kortere enn ikke-animerte filmer. For en standardtest ville han eller hun bestemmeGjennomsnittlig varighet for et utvalg av animerte filmer og for et utvalg av live-action-filmer og sammenligne forskjellen med variansen til prøvene. For Wilcoxon -ikke -parametriske testen blir filmtidene satt i orden fra minst til største, og rekkene til de animerte filmtidene er summert.

Personen kan beregne sannsynligheten for at rangeringssummen ville være den størrelsen eller mindre ved å bestemme antall mulige bestillinger med en gitt rangsum og det totale antallet mulige bestilling, en beregning som er enkel gitt nok beregning av brute kraft. Med to små prøver av seks filmer hver, er det allerede 924 mulige arrangementer av rangeringer, et tall som raskt vokser mye større etter hvert som filmer blir lagt til. Alternativt er det publiserte tabeller som gir sannsynligheter som tilsvarer gitte rangeringssummer for gitte prøvestørrelser. Disse finner du i statistikktekster eller online.

Ikke -parametrisk testing er et voksende felt. Det kan brukes i hvilken som helstfelt der mer konvensjonell statistikk også har blitt brukt. Bruksområder er spesielt vanlige innen samfunnsvitenskap og medisin, spesielt når normalfordeling ikke kan gjelde.

Hva er en ikke -parametrisk test?

ANDRE SPRÅK