¿Qué es una prueba no paramétrica?
Una prueba no paramétrica es un tipo de prueba de hipótesis estadística que no asume una distribución normal. Por esta razón, las pruebas no paramétricas a veces se denominan libres de distribución. Una prueba no paramétrica es más robusta que una prueba estándar, generalmente requiere muestras más pequeñas, es menos probable que se vea afectada por las observaciones periféricas y puede aplicarse con menos suposiciones. Por otro lado, las pruebas no paramétricas pueden ser menos eficientes que sus contrapartes estándar, particularmente si la población realmente se distribuye normalmente. Las pruebas no paramétricas son particularmente efectivas para preguntas que tratan frecuencias y proporciones.
Las pruebas de hipótesis estándar comparan una muestra de una población de prueba con una muestra de una población de control para determinar si la población de prueba es estadísticamente comparable a la población de control. Si la diferencia entre el parámetro o los parámetros de la muestra, generalmente la media y/o varianza, es lo suficientemente grande, entonces elSe puede considerar que la muestra de prueba es distinta de la población de control. Dichas pruebas paramétricas requieren que los parámetros provengan de una distribución normal.
Se ha demostrado matemáticamente que un tamaño de muestra de 30 o más se comportará aproximadamente como una distribución normal, por lo que este requisito generalmente se supone. Sin embargo, si la suposición no está justificada, los resultados de la prueba podrían no ser válidos. Las pruebas no paramétricas evitan esta suposición.
En cambio, las pruebas de hipótesis no paramétricas examina comúnmente los datos, ya sea clasificándolos o ordenándolo. Si la muestra y las poblaciones de control son las mismas y si los datos se recopilaron correctamente, cualquier diferencia entre sus categorías o clasificaciones son estrictamente los resultados del azar. Si la probabilidad de que esas diferencias pudieran haber ocurrido por casualidad aleatoria, también llamada valor p, es menor que un probabili significativo elegidoTy, generalmente 5 por ciento o 1 por ciento, luego el probador rechaza la hipótesis de que las poblaciones de muestra y control son las mismas y concluye que son diferentes.
Una prueba no paramétrica común es una prueba de chi-cuadrado, que se utiliza para comparar frecuencias o proporciones observadas. Cuando solo se examina un conjunto de frecuencias, esto a menudo se llama una prueba de bondad de ajuste y se usa para determinar si las frecuencias observadas se ajustan dentro del rango que se esperaría. Por ejemplo, se podría usar una prueba de bondad de ajuste para determinar si una tabla de la ruleta se había manejado comparando los resultados de la tabla con los resultados que la teoría de probabilidad predice o para determinar si un medicamento para el dolor de cabeza era efectivo al comparar la proporción de personas cuyo dolor de cabeza mejoró en la medicina con la proporción de personas cuyo dolor de cabeza mejoró cuando tomó un placebo. Si se examinan dos frecuencias, entonces la prueba no paramétrica de chi-cuadrado se puede usar para probar la correlación o la independenciaentre factores. Los encuestadores políticos a menudo buscan la correlación entre los factores sociales, económicos o demográficos y las creencias políticas, como ver si existe una correlación entre la educación de una persona y si aprueba cómo está funcionando un funcionario electo.
.Otra prueba no paramétrica es la prueba de suma de rango Wilcoxon, que generalmente se usa en las mismas situaciones que la prueba de hipótesis paramétrica estándar. Sin embargo, en lugar de examinar la media de cada muestra, la prueba de Wilcoxon examina el rango de cada valor si las dos muestras se ordenan de menos a lo mejor. Si las dos muestras son las mismas, cada grupo debe dispersarse uniformemente a través de la clasificación. Si un grupo se agrupa en el extremo inferior o superior de la clasificación, esto indica que los dos grupos son diferentes.
Por ejemplo, suponga que alguien quería determinar si las películas animadas son más largas o más cortas que las películas no animadas. Para una prueba estándar, él o ella determinaría elDuración promedio para una muestra de películas animadas y para una muestra de películas de acción en vivo y compare la diferencia con la varianza de las muestras. Para la prueba no paramétrica de Wilcoxon, los tiempos de la película se ordenan de menos a lo mejor, y se suman las filas de los tiempos de las películas animadas.
La persona podría calcular la probabilidad de que la suma de rango sea ese tamaño o menor al determinar el número de pedidos posibles con una suma de rango determinada y el número total de pedidos posibles, un cálculo que es simple dada la fuerza de cálculo de la fuerza bruta suficiente. Con dos pequeñas muestras de seis películas cada una, ya hay 924 posibles arreglos de clasificaciones, un número que rápidamente crece mucho más grande a medida que se agregan películas. Alternativamente, hay tablas publicadas que dan probabilidades correspondientes a sumas de rango dadas para tamaños de muestra dados. Estos se pueden encontrar en textos de estadísticas o en línea.
Las pruebas no paramétricas son un campo de crecimiento. Se puede aplicar en cualquiercampo en el que también se han utilizado estadísticas más convencionales. Sin embargo, las aplicaciones son particularmente comunes en las ciencias sociales y la medicina, particularmente cuando la distribución normal no puede aplicarse.