Cos'è la distribuzione ipergeometrica?
La distribuzione ipergeometrica descrive la probabilità di determinati eventi quando una sequenza di oggetti viene pescata da un set fisso, come la scelta di carte da gioco da un mazzo. La caratteristica chiave degli eventi che seguono la distribuzione di probabilità ipergeometrica è che gli oggetti non vengono sostituiti tra i sorteggi. Dopo che un determinato oggetto è stato scelto, non può essere nuovamente scelto. Questa funzione è più significativa quando si lavora con popolazioni piccole.
I revisori della valutazione della qualità utilizzano la distribuzione ipergeometrica quando analizzano il numero di prodotti difettosi in un determinato gruppo. I prodotti vengono messi da parte dopo essere stati testati perché non vi è motivo di testare lo stesso prodotto due volte. Pertanto, la selezione viene eseguita senza sostituzione.
Le probabilità del poker sono calcolate usando la distribuzione ipergeometrica perché le carte non vengono rimescolate nel mazzo in una data mano. Inizialmente, ad esempio, un quarto delle carte in un mazzo standard sono picche, ma la probabilità di ricevere due carte e di trovarle entrambe non è 1/4 * 1/4 = 1/16. Dopo aver ricevuto la prima spade, ci sono meno spade rimaste nel mazzo, quindi la probabilità di ricevere un'altra spade è solo 12/51. Quindi, la probabilità di ricevere due carte e trovarle entrambe come picche è 1/4 * 12/51 = 1/17.
Gli oggetti non vengono sostituiti tra i sorteggi, quindi la probabilità di scenari estremi viene ridotta per una distribuzione ipergeometrica. Si può paragonare il fatto di ricevere carte rosse o nere da un mazzo standard con il lancio di una moneta. Una moneta buona finirà sulle "teste" per metà del tempo e metà delle carte in un mazzo standard sono nere. Tuttavia, la probabilità di ottenere cinque teste consecutive quando si lancia una moneta è maggiore della probabilità di ricevere una mano di cinque carte e trovarle tutte come carte nere. La probabilità di cinque teste consecutive è 1/2 * 1/2 * 1/2 * 1/2 * 1/2 = 1/32, o circa il 3 percento, e la probabilità di cinque carte nere è 26/52 * 25 / 51 * 24/50 * 23/49 * 22/48 = 253/9996, ovvero circa il 2,5 percento.
Il campionamento senza sostituzione riduce la probabilità di casi estremi, ma non influisce sulla media aritmetica della distribuzione. Il numero medio di teste previsto quando si lancia una moneta cinque volte è 2,5, e questo equivale al numero medio di carte nere previste in una mano di cinque carte. Proprio come è molto improbabile che tutte e cinque le carte siano nere, è anche improbabile che nessuna di esse lo sia. Questo è descritto in un linguaggio matematico dicendo che la sostituzione riduce la varianza senza influire sul valore atteso di una distribuzione.