Este modelo se
emplea en las extracciones sin reemplazamiento, es decir, en una población
finita cuyos elementos pueden clasificarse en dos categorías: por
ejemplo, una
urna con N1 bolas blancas y N2 bolas negras tal
que N=N1+N2.
Extraemos n bolas sin reemplazamiento y la distribución
hipergeométrica proporciona la probabilidad de que de esas n bolas
extraídas, r bolas sean de un color determinado, por ejemplo blancas.
Los parámetros son ahora N, n, p=
N1/N ó p=
N2/Ny puede comprobarse que el
esquema es similar a la distribución binomial B(n, p), pero con
la diferencia de que las probabilidades en cada extracción van modificándose
al no reponer la bola sacada; se denomina HG(N,n,p).
Una secuencia ordenada que describe
el resultado buscado en las n extracciones, de las cuales r deberán ser
bolas blancas es :
SucesoBBB..........BNN............Nrvecesn-rveces
La probabilidad será:N1N.N1−1N−1....N1−r+1N−r+1...N2N-r.N2−1N−r+1...N2−[n-(r+1)]N−(n+1)
y como hay que considerar todas las disposiciones con independencia del
orden serán las permutaciones con repetición:
Pr,n−rn=(nr)
su función de probabilidad será,
P(X=r)=n!r!(n−r)!.N1!(N1−r)!.N2!(N2−(n−r))!N!(N−n)!=(N1r)(N2n−r)(Nn)
Expresión que también nos proporciona el número de
elementos defectuosos en una muestra de tamaño n.
Como el número de bolas blancas extraídas no puede
ser mayor que el número de bolas blancas totales N1 , ni del
número de bolas extraídas, tampoco podrá ser inferior a 0 ni a n-N2
, es decir,max(0,n-N2)≤r≤min(n,N1)
La esperanza y la varianza son:E(X)=n.pσ2=n.p.q.N−nN−1
donde p=N1/N
y q=1-p.
Cuando N es grande respecto de n (n/N < 0.1)
se puede sustituir la distribución hipergeométrica por la binomial