Tabla de contenidos
¿Qué es la distribución de probabilidad hipergeométrica?
En la distribución de probabilidad hipergeométrica, a diferencia de la distribución binomial, los ensayos no son independientes y la probabilidad de éxito es variable de ensayo a ensayo. La distribución hipergeométrica considera el número de éxitos r en una población de tamaño N, luego N-r denota el número de fracasos en la población. Sirve para calcular la probabilidad de encontrar, sin reemplazos, x éxitos y n-x fracasos en una muestra aleatoria.
La función de probabilidad hipergeométrica se calcula con la siguiente fórmula:

Donde, f(x) es la probabilidad de x éxitos en n ensayos, N el tamaño de la población y r el número de éxitos en la población. El denominador representa el número de maneras en que podemos tomar una muestra aleatoria de tamaño n de una población de tamaño N. La primera combinación del numerador representa el número de maneras en que podemos tomar x éxitos de r éxitos en la población. Análogamente, la segunda combinación del numerador representa el número de maneras en que podemos tomar n-x fracasos de N-r fracasos en la población. Considerando la regla de conteo para combinaciones, la función de probabilidad hipergeométrica se puede escribir de la siguiente manera:

Ejemplo distribución de probabilidad hipergeométrica
Consideremos que se inspecciona el etiquetado de un lote de 25 cajas (N=25), se toma una muestra aleatoria de 7 cajas (n=7), se sabe que 2 de ellas están mal etiquetadas (r=2). ¿Cuál es la probabilidad de encontrar exactamente una caja mal etiquetada en la muestra?
Se utiliza la función de probabilidad hipergeométrica para estimar la probabilidad de encontrar exactamente una caja mal etiquetada en la muestra (x=1):

La probabilidad de encontrar exactamente una caja mal etiquetada en la muestra es igual a 0.42. ¿Qué pasa si se desea conocer la probabilidad de encontrar por lo menos una caja mal etiquetada (P(x≥1))? Para ello, calculamos la probabilidad de no encontrar ninguna caja mal etiquetada y la restamos de 1:

Calculando la probabilidad de no encontrar ninguna caja mal etiquetada tenemos:

La probabilidad de no encontrar ninguna caja mal etiquetada es igual a 0.51, ahora, restamos esta probabilidad de 1:

Es algo probable que se encuentre por lo menos una caja con un etiquetado defectuoso (P(x≥1)=0.49).
Valor esperado y varianza en la distribución de probabilidad hipergeométrica
El valor esperado (E(x)), la varianza (Var(x)) y la desviación estándar (σ) de una distribución de probabilidad hipergeométrica se calculan de la siguiente manera:

Retomando el ejemplo de inspección del etiquetado del lote de cajas, calculamos el valor medio, la varianza y la desviación estándar:

Al aplicar la función de probabilidad hipergeométrica para x=2, se tiene que f(x=2)=0.07, entonces:

Uso de Excel para la distribución de probabilidad hipergeométrica
La función DISTR.HIPERGEOM.N tiene cinco argumentos, muestra_éxito corresponde al valor de la variable aleatoria, núm_de_muestra es el valor de n, población_éxito es el valor de r, núm_de_población es el valor de N, y acumulado es igual a 0 para calcular la función de probabilidad o a 1 para obtener la función de probabilidad acumulada.
La siguiente imagen muestra cómo ingresar las fórmulas en una hoja de Excel:

La salida de Excel es la siguiente:

Estos resultados coinciden con nuestros cálculos previos.