O que é um teste não paramétrico?
Um teste não paramétrico é um tipo de teste de hipótese estatística que não assume uma distribuição normal. Por esse motivo, os testes não paramétricos às vezes são chamados de livres de distribuição. Um teste não paramétrico é mais robusto que um teste padrão, geralmente requer amostras menores, é menos provável de ser afetado por observações externas e pode ser aplicado com menos suposições. Por outro lado, testes não paramétricos podem ser menos eficientes do que seus equivalentes padrão, principalmente se a população realmente estiver normalmente distribuída. O teste não paramétrico é particularmente eficaz para perguntas que lidam com frequências e proporções.
O teste de hipóteses padrão compara uma amostra de uma população de teste com uma amostra de uma população de controle para determinar se a população de teste é estatisticamente comparável à população de controle. Se a diferença entre o parâmetro ou parâmetros da amostra - geralmente a média e / ou variância - for grande o suficiente, a amostra de teste poderá ser considerada distinta da população controle. Esse teste paramétrico requer que os parâmetros venham de uma distribuição normal.
Foi matematicamente comprovado que um tamanho de amostra de 30 ou mais se comportará aproximadamente como uma distribuição normal, portanto, esse requisito é geralmente assumido. Se a suposição não for justificada, no entanto, os resultados do teste podem não ser válidos. O teste não paramétrico evita essa suposição.
Em vez disso, o teste de hipóteses não paramétrico geralmente examina os dados categorizando-os ou ordenando-os. Se as populações de amostra e controle forem as mesmas e se os dados foram coletados corretamente, quaisquer diferenças entre suas categorias ou classificações são estritamente o resultado do acaso. Se a probabilidade de que essas diferenças possam ter ocorrido por acaso, também chamado de valor P, é menor que a probabilidade significativa escolhida, geralmente de 5% ou 1%, o testador rejeita a hipótese de que a amostra e as populações de controle sejam as mesmo e conclui que eles são diferentes.
Um teste não paramétrico comum é o teste do qui-quadrado, usado para comparar frequências ou proporções observadas. Quando apenas um conjunto de frequências é examinado, isso geralmente é chamado de teste de adequação e é usado para determinar se as frequências observadas se ajustam à faixa esperada. Por exemplo, um teste de qualidade do ajuste pode ser usado para determinar se uma mesa de roleta foi manipulada comparando os resultados da tabela com os resultados que a teoria da probabilidade prevê ou para determinar se um medicamento para dor de cabeça foi eficaz comparando a proporção de pessoas cuja dor de cabeça melhorou o medicamento para a proporção de pessoas cuja dor de cabeça melhorou quando tomaram um placebo. Se duas frequências são examinadas, o teste não paramétrico do qui-quadrado pode ser usado para testar a correlação ou independência entre os fatores. Os pesquisadores políticos geralmente procuram correlação entre fatores sociais, econômicos ou demográficos e crenças políticas, como verificar se existe uma correlação entre a educação de uma pessoa e se ela aprova o desempenho de um funcionário eleito.
Outro teste não paramétrico é o teste da soma da classificação de Wilcoxon, que geralmente é usado nas mesmas situações dos testes de hipóteses paramétricas padrão. Em vez de examinar a média de cada amostra, no entanto, o teste de Wilcoxon examina a classificação de cada valor se as duas amostras são ordenadas do menor para o maior. Se as duas amostras forem iguais, cada grupo deve ser distribuído uniformemente pelo ranking. Se um grupo estiver agrupado na extremidade inferior ou superior da classificação, isso indica que os dois grupos são diferentes.
Por exemplo, suponha que alguém desejasse determinar se os filmes animados são mais longos ou mais curtos que os filmes não animados. Para um teste padrão, ele ou ela determinaria a duração média de uma amostra de filmes de animação e de uma amostra de filmes de ação ao vivo e compararia a diferença com a variação das amostras. Para o teste não paramétrico de Wilcoxon, os horários dos filmes são ordenados do menor para o maior, e as fileiras dos horários dos filmes animados são somadas.
A pessoa poderia calcular a probabilidade de que a soma da classificação fosse desse tamanho ou menor, determinando o número de pedidos possíveis com uma determinada soma de classificação e o número total de pedidos possíveis, um cálculo que é simples, considerando a força de cálculo da força bruta suficiente. Com duas pequenas amostras de seis filmes cada, já existem 924 arranjos possíveis de classificações, um número que cresce rapidamente muito maior à medida que os filmes são adicionados. Como alternativa, existem tabelas publicadas que fornecem probabilidades correspondentes a somas de classificação determinadas para tamanhos de amostra determinados. Estes podem ser encontrados em textos estatísticos ou online.
O teste não paramétrico é um campo em crescimento. Pode ser aplicado em qualquer campo em que estatísticas mais convencionais também tenham sido usadas. As aplicações são particularmente comuns nas ciências sociais e na medicina, no entanto, principalmente quando a distribuição normal não pode ser aplicada.