O que é distribuição hipergeométrica?
A distribuição hipergeométrica descreve a probabilidade de certos eventos quando uma sequência de itens é retirada de um conjunto fixo, como escolher cartas de baralho. A principal característica dos eventos após a distribuição de probabilidade hipergeométrica é que os itens não são substituídos entre os sorteios. Após um objeto específico ter sido escolhido, ele não pode ser escolhido novamente. Esse recurso é mais significativo ao trabalhar com pequenas populações.
Os auditores de avaliação da qualidade usam a distribuição hipergeométrica ao analisar o número de produtos defeituosos em um determinado grupo. Os produtos são retirados após o teste porque não há motivo para testar o mesmo produto duas vezes. Assim, a seleção é feita sem substituição.
As probabilidades de pôquer são calculadas usando a distribuição hipergeométrica, porque as cartas não são embaralhadas de volta ao baralho dentro de uma determinada mão. Inicialmente, por exemplo, um quarto das cartas de um baralho padrão são espadas, mas a probabilidade de receber duas cartas e achar que ambas são espadas não é 1/4 * 1/4 = 1/16. Depois de receber a primeira pá, restam menos espadas no baralho, então a probabilidade de receber outra pá é de apenas 12/51. Portanto, a probabilidade de receber duas cartas e achar que ambas são espadas é 1/4 * 12/51 = 1/17.
Como os objetos não são substituídos entre os sorteios, a probabilidade de cenários extremos é reduzida para uma distribuição hipergeométrica. Pode-se comparar ser distribuído cartões vermelhos ou pretos de um baralho padrão para lançar uma moeda. Uma moeda justa cairá sobre as “cabeças” metade do tempo e metade das cartas em um baralho padrão é preta. No entanto, a probabilidade de ganhar cinco caras consecutivas ao jogar uma moeda é maior do que a probabilidade de receber uma mão de cinco cartas e achar que todas são cartas pretas. A probabilidade de cinco chefes consecutivos é 1/2 * 1/2 * 1/2 * 1/2 * 1/2 = 1/32, ou cerca de 3%, e a probabilidade de cinco cartões pretos é 26/52 * 25 / 51 * 24/50 * 23/49 * 22/48 = 253/9996, ou cerca de 2,5 por cento.
A amostragem sem substituição reduz a probabilidade de casos extremos, mas não afeta a média aritmética da distribuição. O número médio de caras esperado quando alguém joga uma moeda cinco vezes é 2,5, e isso é igual ao número médio de cartões pretos esperados em uma mão de cinco cartas. Assim como é muito improvável que todas as cinco cartas sejam pretas, também é improvável que nenhuma delas seja. Isso é descrito na linguagem matemática, dizendo que a substituição reduz a variação sem afetar o valor esperado de uma distribuição.