Vad är hypergeometrisk distribution?

Hypergeometrisk fördelning beskriver sannolikheten för vissa händelser när en sekvens av föremål dras från en fast uppsättning, som att välja spelkort från en kortlek. Det viktigaste kännetecknet för händelser som följer den hypergeometriska sannolikhetsfördelningen är att föremålen inte ersätts mellan dragningarna. Efter att ett visst objekt har valts kan det inte väljas igen. Denna funktion är mest betydelsefull när man arbetar med små populationer.

Kvalitetsbedömningsrevisorer använder den hypergeometriska fördelningen när de analyserar antalet defekta produkter i en given grupp. Produkter ställs åt sidan efter att de testats eftersom det inte finns någon anledning att testa samma produkt två gånger. Således görs valet utan ersättning.

Pokersannolikheter beräknas med hjälp av den hypergeometriska fördelningen eftersom korten inte blandas tillbaka i kortleken inom en given hand. Till en början är till exempel en fjärdedel av korten i en standardlek spader, men sannolikheten för att få två kort och finna att båda är spader är inte 1/4 * 1/4 = 1/16. Efter att ha fått den första spaden finns det färre spader kvar i leken, så sannolikheten att få ytterligare en spader är bara 12/51. Därför är sannolikheten att få två kort och finna att de båda är spader 1/4 * 12/51 = 1/17.

Objekt byts inte ut mellan dragningarna, så sannolikheten för extrema scenarier reduceras för en hypergeometrisk fördelning. Man kan jämföra att få röda eller svarta kort från en standardlek med att vända ett mynt. Ett rättvist mynt kommer att landa på ”huvuden” halva tiden, och hälften av korten i en standardlek är svarta. Ändå är sannolikheten att få fem på varandra följande huvuden när du slår ett mynt större än sannolikheten att få en femkortshand och upptäcka att alla är svarta kort. Sannolikheten för fem på varandra följande huvuden är 1/2 * 1/2 * 1/2 * 1/2 * 1/2 = 1/32, eller cirka 3 procent, och sannolikheten för fem svarta kort är 26/52 * 25/ 51 * 24/50 * 23/49 * 22/48 = 253/9996, eller cirka 2.5 procent.

Sampling utan ersättning minskar sannolikheten för extremfall, men det påverkar inte det aritmetiska medelvärdet av fördelningen. Det genomsnittliga antalet huvuden som förväntas när man slår ett mynt fem gånger är 2.5, och detta motsvarar det genomsnittliga antalet svarta kort som förväntas i en femkortshand. Precis som det är mycket osannolikt att alla fem korten är svarta, är det också osannolikt att inget av dem är det. Detta beskrivs i matematiskt språk genom att säga att ersättning sänker variansen utan att påverka det förväntade värdet av en fördelning.