Qu'est-ce qu'un test non paramétrique?
Un test non paramétrique est un type de test d'hypothèse statistique qui ne suppose pas une distribution normale. Pour cette raison, les tests non paramétriques sont parfois qualifiés de non distribués. Un test non paramétrique est plus robuste qu'un test standard, nécessite généralement des échantillons plus petits, est moins susceptible d'être affecté par les observations périphériques et peut être appliqué avec moins d'hypothèses. D'autre part, les tests non paramétriques peuvent être moins efficaces que leurs homologues standard, en particulier si la population est réellement répartie normalement. Les tests non paramétriques sont particulièrement efficaces pour les questions portant sur les fréquences et les proportions.
Le test d'hypothèse standard compare un échantillon d'une population testée à un échantillon d'une population témoin pour déterminer si la population testée est statistiquement comparable à la population témoin. Si la différence entre le paramètre ou les paramètres de l'échantillon - généralement la moyenne et / ou la variance - est suffisamment grande, l'échantillon de test peut alors être considéré comme distinct de la population témoin. Un tel test paramétrique nécessite que les paramètres proviennent d'une distribution normale.
Il a été mathématiquement prouvé qu'une taille d'échantillon de 30 ou plus se comporterait approximativement comme une distribution normale, c'est pourquoi cette exigence est généralement supposée. Si l'hypothèse n'est pas justifiée, les résultats des tests risquent de ne pas être valides. Les tests non paramétriques évitent cette hypothèse.
Au lieu de cela, le test d'hypothèses non paramétriques examine généralement les données en les catégorisant ou en les ordonnant. Si les populations de l'échantillon et du contrôle sont les mêmes et si les données ont été recueillies correctement, toute différence entre leurs catégories ou leurs classements est strictement le résultat du hasard. Si la probabilité que ces différences se soient produites par hasard, également appelée valeur P, est inférieure à une probabilité significative choisie, généralement 5% ou 1%, alors le testeur rejette l'hypothèse selon laquelle les populations de l'échantillon et du contrôle sont les même et conclut qu'ils sont différents.
Un test non paramétrique commun est le test du chi carré, utilisé pour comparer les fréquences ou les proportions observées. Lorsque l'on examine un seul ensemble de fréquences, on parle souvent de test de qualité de l'ajustement. Il est utilisé pour déterminer si les fréquences observées s'inscrivent dans la plage attendue. Par exemple, un test de qualité de l'ajustement pourrait être utilisé pour déterminer si une table de roulette avait été ajustée en comparant les résultats d'une table aux résultats prédits par la théorie de la probabilité, ou pour déterminer si un médicament contre les maux de tête était efficace en comparant la proportion de personnes présentant des maux de tête. amélioré le médicament à la proportion de personnes dont le mal de tête s’est amélioré quand ils ont pris un placebo. Si deux fréquences sont examinées, alors le test non paramétrique du chi carré peut être utilisé pour tester la corrélation ou l'indépendance entre les facteurs. Les enquêteurs politiques recherchent souvent une corrélation entre des facteurs sociaux, économiques ou démographiques et des convictions politiques, par exemple pour déterminer s’il existe une corrélation entre l’éducation d’une personne et son approbation du comportement de l’élu.
Un autre test non paramétrique est le test de Wilcoxon rank sum, qui est généralement utilisé dans les mêmes situations que le test d'hypothèse paramétrique standard. Au lieu d’examiner la moyenne de chaque échantillon, toutefois, le test de Wilcoxon examine le rang de chaque valeur si les deux échantillons sont classés du plus petit au plus grand. Si les deux échantillons sont identiques, chaque groupe doit être réparti uniformément dans le classement. Si un groupe est regroupé à l'extrémité inférieure ou supérieure du classement, cela signifie que les deux groupes sont différents.
Par exemple, supposons que quelqu'un veuille déterminer si les films animés sont plus longs ou plus courts que les films non animés. Pour un test standard, il ou elle déterminerait la durée moyenne d'un échantillon de films d'animation et d'un échantillon de films d'action réelle et comparerait la différence à la variance des échantillons. Pour le test non paramétrique de Wilcoxon, les temps de film sont classés par ordre croissant, et les rangs des temps de film d’animation sont résumés.
La personne peut calculer la probabilité que la somme du rang soit égale ou inférieure à cette taille en déterminant le nombre de classements possibles avec une somme de rang donnée et le nombre total de classements possibles, un calcul simple avec une force de calcul de force brute suffisante. Avec deux petits échantillons de six films chacun, il existe déjà 924 arrangements possibles de classement, un nombre qui grossit rapidement à mesure que des films sont ajoutés. Alternativement, il existe des tableaux publiés qui donnent des probabilités correspondant à des sommes de rang données pour des tailles d'échantillon données. Ceux-ci peuvent être trouvés dans des textes statistiques ou en ligne.
Le test non paramétrique est un domaine en pleine croissance. Il peut être appliqué à tout domaine dans lequel des statistiques plus conventionnelles ont également été utilisées. Les applications sont particulièrement courantes dans les sciences sociales et la médecine, en particulier lorsque la distribution normale ne peut pas s'appliquer.