Wat is een niet -parametrische test?
Een niet -parametrische test is een type statistische hypothese -testen die geen normale verdeling veronderstelt. Om deze reden worden niet-parametrische tests soms distributievrij genoemd. Een niet -parametrische test is robuuster dan een standaardtest, die over het algemeen kleinere monsters vereist, is minder kans om te worden beïnvloed door afgelegen observaties en kan met minder veronderstellingen worden toegepast. Aan de andere kant kunnen niet -parametrische tests minder efficiënt zijn dan hun standaard tegenhangers, vooral als de bevolking echt normaal wordt verdeeld. Niet -parametrische testen zijn met name effectief voor vragen over frequenties en verhoudingen.
Standaardhypothesetests vergelijkt een steekproef van een testpopulatie tot een steekproef van een controlepopulatie om te bepalen of de testpopulatie statistisch vergelijkbaar is met de controlepopulatie. Als het verschil tussen de monsterparameter of parameters - meestal het gemiddelde en/of variantie - groot genoeg is, danTeststeekproef kan worden beoordeeld als verschillend van de controlepopulatie. Dergelijke parametrische tests vereisen dat de parameters afkomstig zijn van een normale verdeling.
Het is wiskundig bewezen dat een steekproefomvang van 30 of meer zich ongeveer een normale verdeling zal gedragen, dus deze vereiste wordt algemeen aangenomen. Als de veronderstelling niet gerechtvaardigd is, zijn de resultaten van de test mogelijk niet geldig. Niet -parametrische testen vermijdt deze veronderstelling.
In plaats daarvan onderzoekt niet -parametrische hypothese -testen vaak gegevens door deze te categoriseren of door het te bestellen. Als de steekproef- en controlepopulaties hetzelfde zijn en als de gegevens correct zijn verzameld, zijn eventuele verschillen tussen hun categorieën of ranglijsten strikt de resultaten van toeval. Als de kans dat die verschillen door willekeurige kans hadden kunnen plaatsvinden, ook wel een p-waarde genoemd, minder is dan een gekozen significante probabiliTy, meestal 5 procent of 1 procent, dan verwerpt de tester de hypothese dat de steekproef- en controlepopulaties hetzelfde zijn en concludeert dat ze anders zijn.
Een gemeenschappelijke niet-parametrische test is een chikwadraat-test, die wordt gebruikt om waargenomen frequenties of verhoudingen te vergelijken. Wanneer slechts één set frequenties wordt onderzocht, wordt dit vaak een goedheidstest genoemd en wordt deze gebruikt om te bepalen of de waargenomen frequenties binnen het bereik passen dat zou worden verwacht. Een goedheid-van-fit-test kan bijvoorbeeld worden gebruikt om te bepalen of een roulette-tabel was opgetuigd door tabelresultaten te vergelijken met de resultaten die waarschijnlijkheidstheorie voorspelt of om te bepalen of een hoofdpijngeneeskunde effectief was door het aandeel mensen te vergelijken wiens hoofdpijn op het medicijn verbeterde met het aandeel van mensen wiens hoofdpijn verbeterde toen ze een placebo namen. Als twee frequenties worden onderzocht, kan de chi-kwadraat niet-parametrische test worden gebruikt om te testen op correlatie of onafhankelijkheidtussen factoren. Politieke pollsters zoeken vaak naar een correlatie tussen sociale, economische of demografische factoren en politieke overtuigingen, zoals kijken of er een verband bestaat tussen het opleiding van een persoon en of hij of zij het goedkeurt over hoe een gekozen functionaris presteert.
Een andere niet -parametrische test is de Wilcoxon Rank Sum -test, die in het algemeen in dezelfde situaties wordt gebruikt als standaard parametrische hypothese -testen. In plaats van het gemiddelde van elke steekproef te onderzoeken, onderzoekt de Wilcoxon -test echter de rang van elke waarde als de twee monsters van het minst tot het grootst worden besteld. Als de twee monsters hetzelfde zijn, moet elke groep gelijkmatig worden verspreid door de rangorde. Als een groep is geclusterd aan het onderste of bovenste uiteinde van de rangorde, geeft dit aan dat de twee groepen verschillen.
Stel bijvoorbeeld dat iemand wilde bepalen of animatiefilms langer of korter zijn dan niet-geanimeerde films. Voor een standaardtest zou hij of zij deGemiddelde duur voor een voorbeeld van animatiefilms en voor een voorbeeld van live-actiefilms en het verschil vergelijken met de variantie van de monsters. Voor de niet -parametrische test van Wilcoxon worden de filmtijden van minst tot het beste in orde gebracht, en de rangen van de animatiefilmtijden worden samengevat.
De persoon zou de kans kunnen berekenen dat de rangor een grootte of kleiner zou zijn door het aantal mogelijke ordeningen te bepalen met een gegeven rangorde en het totale aantal mogelijke ordening, een berekening die eenvoudig is gegeven voldoende brute krachtberekeningsterkte. Met twee kleine voorbeelden van zes films elk, zijn er al 924 mogelijke arrangementen van ranglijsten, een aantal dat snel veel groter wordt naarmate films worden toegevoegd. Als alternatief zijn er gepubliceerde tabellen die waarschijnlijkheden geven die overeenkomen met gegeven rang sommen voor gegeven steekproefgroottes. Deze zijn te vinden in statistische teksten of online.
Niet -parametrische testen is een groeiend veld. Het kan in elkeveld waarin ook meer conventionele statistieken zijn gebruikt. Toepassingen komen met name gebruikelijk in de sociale wetenschappen en geneeskunde, met name, met name wanneer de normale verdeling niet van toepassing kan zijn.