Wat is een niet-parametrische test?
Een niet-parametrische test is een type statistische hypothesetest die geen normale verdeling veronderstelt. Om deze reden worden niet-parametrische tests soms distributievrij genoemd. Een niet-parametrische test is robuuster dan een standaardtest, vereist doorgaans kleinere monsters, heeft minder kans om te worden beïnvloed door externe waarnemingen en kan met minder aannames worden toegepast. Aan de andere kant kunnen niet-parametrische tests minder efficiënt zijn dan hun standaardtegenhangers, vooral als de populatie echt normaal verdeeld is. Niet-parametrische testen zijn met name effectief voor vragen over frequenties en verhoudingen.
Standaard hypothesetesten vergelijken een steekproef uit een testpopulatie met een steekproef uit een controlepopulatie om te bepalen of de testpopulatie statistisch vergelijkbaar is met de controlepopulatie. Als het verschil tussen de steekproefparameter of -parameters - meestal het gemiddelde en / of de variantie - groot genoeg is, kan de teststeekproef worden onderscheiden van de controlepopulatie. Dergelijke parametrische tests vereisen dat de parameters afkomstig zijn van een normale verdeling.
Het is wiskundig bewezen dat een steekproefgrootte van 30 of meer zich ongeveer als een normale verdeling zal gedragen, dus deze eis wordt algemeen aangenomen. Als de veronderstelling niet gerechtvaardigd is, zijn de resultaten van de tests mogelijk niet geldig. Niet-parametrische testen vermijden deze veronderstelling.
In plaats daarvan worden niet-parametrische hypothesetests meestal onderzocht door gegevens te categoriseren of te ordenen. Als de steekproef- en controlepopulaties hetzelfde zijn en als de gegevens correct zijn verzameld, zijn eventuele verschillen tussen hun categorieën of ranglijsten strikt het toeval. Als de waarschijnlijkheid dat die verschillen door willekeurige toeval zouden kunnen zijn ontstaan, ook wel een P-waarde genoemd, kleiner is dan een gekozen significante waarschijnlijkheid, meestal 5 procent of 1 procent, dan verwerpt de tester de hypothese dat de steekproef- en controlepopulaties de hetzelfde en concludeert dat ze verschillend zijn.
Een veel voorkomende niet-parametrische test is een Chi-kwadraat test, gebruikt om waargenomen frequenties of verhoudingen te vergelijken. Wanneer slechts één set frequenties wordt onderzocht, wordt dit vaak een goodness-of-fit-test genoemd en wordt deze gebruikt om te bepalen of de waargenomen frequenties binnen het verwachte bereik passen. Een goodness-of-fit-test kan bijvoorbeeld worden gebruikt om te bepalen of een roulettetafel is opgetuigd door tabelresultaten te vergelijken met de resultaten die de waarschijnlijkheidstheorie voorspelt of om te bepalen of een hoofdpijngeneesmiddel effectief was door het aandeel mensen te vergelijken bij wie de hoofdpijn verbetering van het geneesmiddel voor het aandeel mensen bij wie de hoofdpijn verbeterde bij het nemen van een placebo. Als twee frequenties worden onderzocht, kan de Chi-kwadraat niet-parametrische test worden gebruikt om te testen op correlatie of onafhankelijkheid tussen factoren. Politieke opiniepeilers zoeken vaak naar een verband tussen sociale, economische of demografische factoren en politieke overtuigingen, zoals kijken of er een verband bestaat tussen iemands opleiding en of hij of zij goedkeurt hoe een gekozen functionaris presteert.
Een andere niet-parametrische test is de Wilcoxon rank sum-test, die over het algemeen in dezelfde situaties wordt gebruikt als standaard parametrische hypothesetests. In plaats van het gemiddelde van elke steekproef te onderzoeken, onderzoekt de Wilcoxon-test echter de rangorde van elke waarde als de twee steekproeven van de minste tot de grootste worden geordend. Als de twee steekproeven hetzelfde zijn, moet elke groep gelijkmatig over de rangorde worden verdeeld. Als een groep aan de onderkant of bovenkant van de ranglijst is geclusterd, geeft dit aan dat de twee groepen verschillend zijn.
Stel bijvoorbeeld dat iemand wilde bepalen of geanimeerde films langer of korter zijn dan niet-geanimeerde films. Voor een standaardtest zou hij of zij de gemiddelde duur voor een voorbeeld van geanimeerde films en voor een voorbeeld van live-actiefilms bepalen en het verschil vergelijken met de variantie van de monsters. Voor de niet-parametrische test van Wilcoxon worden de filmtijden in volgorde van minst tot groot gezet en worden de rangen van de animatiefilmtijden opgeteld.
De persoon zou de waarschijnlijkheid kunnen berekenen dat de rangsom die grootte of kleiner zou zijn door het aantal mogelijke bestellingen met een gegeven rangsom en het totale aantal mogelijke bestellingen te bepalen, een berekening die eenvoudig is gegeven voldoende brute kracht berekeningssterkte. Met twee kleine voorbeelden van elk zes films zijn er al 924 mogelijke rangschikkingen, een aantal dat snel veel groter wordt naarmate films worden toegevoegd. Als alternatief zijn er gepubliceerde tabellen die kansen geven die overeenkomen met gegeven rangsommen voor gegeven steekproefgroottes. Deze zijn te vinden in statistiekteksten of online.
Niet-parametrisch testen is een groeiend veld. Het kan worden toegepast in elk veld waarin ook meer conventionele statistieken zijn gebruikt. Toepassingen zijn vooral gebruikelijk in de sociale wetenschappen en de geneeskunde, vooral wanneer normale distributie niet van toepassing kan zijn.