Tabla de contenidos
¿Qué es la distribución normal?
La distribución de probabilidad normal es sumamente importante para la inferencia estadística por sus vastas aplicaciones prácticas en áreas como el control de calidad, finanzas, economía, ingeniería, demografía, etc. Se representa mediante una curva simétrica y continua con forma de campana, en la cual se observa que los valores de una variable aleatoria se distribuyen alrededor de su media.
La función de densidad de probabilidad que define la curva normal es la siguiente:

Donde, μ es la media, σ es la desviación estándar, π es una constante igual a 3.14159 y e es otra constante cuyo valor es 2.71828. Graficando para μ=4 y σ=0.5, tenemos:

Como ya se ha señalado, la distribución normal tiene forma de campana. Los parámetros μ y σ determinan su localización y forma. Por ejemplo, la siguiente gráfica muestra que, al fijar el valor de la desviación estándar (σ=1) y variar la media (μ), la curva normal se desplaza a izquierda o derecha:

En cambio, si fijamos la media (μ=0) y variamos la desviación estándar, tenemos la siguiente gráfica:

Como se ha visto, la media de una distribución normal puede ser negativa, cero o positiva. Entre más grande es la desviación estándar, mayor es la dispersión de los datos. Una desviación estándar grande se relaciona con curvas normales más planas y anchas, la razón es que los datos se encuentran más dispersos, en otras palabras, la variabilidad de los datos es mayor. Además, el punto más alto de la curva normal corresponde a la media, mediana y moda. Tomando como referencia la media, la distribución normal es simétrica, el lado izquierdo es una imagen especular del lado derecho, esto significa que su sesgo es igual a cero, es una distribución no sesgada. Ambas colas de la curva normal se extienden infinitamente y, teóricamente, nunca tocan el eje horizontal.
Dado que es una distribución de probabilidad continua, el área bajo la campana es igual a 1, recordando que es simétrica, el área se reparte equitativamente, 0.5 a la izquierda de la media y 0.5 a la derecha de la media. Muy importante, la probabilidad de la variable aleatoria continua se determina calculando el área bajo la curva normal.
Distribución normal estándar
La distribución normal estándar es una distribución normal con media igual a cero (μ=0) y desviación estándar igual a 1 (σ=1). La variable aleatoria de una distribución normal estándar se denota con la letra z. Dadas estas características, la función de densidad de probabilidad normal estándar es la siguiente:

Afortunadamente, para calcular la probabilidad se cuenta con tablas que proporcionan las áreas bajo la curva normal, siendo así, podemos prescindir del cálculo integral. Por ejemplo, la probabilidad de que z sea menor o igual a 1.5 (P(z≤1.5)) es una probabilidad acumulada, puesto que es el área sombreada bajo la curva normal a la izquierda de z=1.5, tal y como se muestra en la siguiente gráfica:

Al consultar la tabla de distribución de probabilidad normal estándar, la probabilidad acumulada asociada a z=1.5 es igual a 0.93319. Para encontrar este valor en la siguiente tabla, primero localizamos el renglón cuyo encabezado es 1.5, luego nos desplazamos a la primera columna a la izquierda con el encabezado 0.00, en la intersección de renglón y columna, leemos 0.93319. Entonces, P(z≤1.5)=0.93319.

Sabiendo que P(z≤1.5)=0.93319 y que el área total debajo de la curva normal es igual a 1, podemos calcular la probabilidad de que z sea mayor a 1.5 (P(z>1.5)), restando 0.93319 de 1:

Esta probabilidad corresponde al área bajo la curva normal a la derecha de z=1.5, tal y como se muestra en la gráfica anterior.
¿Cuál es la probabilidad de que la variable aleatoria z se encuentre a no más de dos desviaciones estándar de la media, P(-2≤z≤2)? En tablas, encontramos que P(z≤2)=0.97725, luego P(z≤-2) la calculamos de la siguiente manera:

Por último, restamos P(z≤-2) de P(z≤2):

En la siguiente gráfica, se muestra el área sombreada bajo la curva normal que corresponde a P(-2≤z≤2). Para comprender el procedimiento anterior y recordando que la curva normal es simétrica, es importante notar que las áreas no sombreadas en los extremos de las colas son iguales, es decir:


Hallar el valor z a partir de una probabilidad
Otro problema consiste en encontrar el valor de z dada una probabilidad. Nuevamente, se recurre a las tablas. Por ejemplo, si la probabilidad es 0.90658, el valor z correspondiente es 1.32. El primer paso es buscar la probabilidad más cercana a 0.90658, luego buscamos el encabezado del renglón en el que encontramos dicha probabilidad (1.3), enseguida identificamos el encabezado de la columna asociada a la probabilidad buscada (0.02), así obtenemos 1.32 (1.3 y 0.02).

Si la probabilidad dada es 0.82601, el valor de z es 0.94. Al buscar en las tablas, no encontramos exactamente 0.82601, pues se encuentra entre 0.82381 y 0.82639. Sin embargo, la probabilidad acumulada más cercana es 0.82639, luego identificamos el encabezado del renglón asociado a esta probabilidad (0.9) y después el encabezado de la correspondiente columna (0.04), de tal modo que z=0.94 (0.9 y 0.04).

Si el área bajo la curva en la cola superior es 0.05, entonces, el área bajo la curva normal a la izquierda del valor desconocido de z es igual a 0.95, es esta probabilidad acumulada la que buscamos en las tablas. La probabilidad acumulada más cercana es 0.94950, misma que corresponde a un valor z igual a 1.64, la probabilidad aproximada de que z sea menor a 1.64 es igual a 0.95, lo que implica que la probabilidad aproximada de que z sea mayor o igual a 1.64 es igual a 0.05, P(z≥1.64)=0.05.

Tablas de la distribución de probabilidad normal estándar
Como se ha explicado en los ejemplos previos, es posible usar las tablas para encontrar una probabilidad acumulada dado un valor para la variable aleatoria z, también es posible encontrar un valor de z dada una probabilidad. Una gráfica de la distribución de probabilidad normal estándar puede ser de ayuda para entender el problema que se quiere resolver. A continuación, se proporcionan las tablas de la distribución de probabilidad normal estándar:


Cálculo de probabilidades de cualquier distribución de probabilidad normal
Sea una distribución normal con media μ y desviación estándar σ, las preguntas sobre las probabilidades de esta distribución se contestan después de pasar a la distribución normal estándar. Para convertir una variable aleatoria x con media μ y desviación estándar σ a la variable aleatoria normal estándar z se utiliza la siguiente fórmula:

Es importante notar que cuando la variable aleatoria x es igual a su media (x= μ), el valor z es igual a cero:

Si la variable aleatoria x se localiza a una desviación estándar por arriba de la media (x=μ+σ), el valor de z es igual a 1:

Entonces, z se puede interpretar como el número de desviaciones estándar a las que está una variable aleatoria x de su media μ. El punto z es una medida de localización relativa, pues determina lo lejos que un valor se encuentra de la media: el 68.3% de los datos se encuentran a una desviación estándar de la media, el 95.4% de los datos a dos desviaciones estándar de la media y el 99.7% de los datos a tres desviaciones estándar de la media.

Consideremos una distribución normal con una media igual a 4 (μ =4) y una desviación estándar igual a 0.5 (σ=0.5). ¿Cuál es la probabilidad de que la variable aleatoria x se encuentre entre 3 y 4.5, P(3≤x≤4.5)? Calculamos los valores z de los extremos del intervalo:

Los resultados indican que 3 se encuentra a dos desviaciones estándar a la izquierda de la media, y 4.5 a una desviación estándar a la derecha de la media. Reformulemos la pregunta en términos de z: ¿cuál es la probabilidad de que la variable aleatoria z se encuentre entre -2 y 1, P(-2≤z≤1)? Después de consultar las tablas, tenemos:

La probabilidad de que la variable aleatoria x se encuentre entre 2 desviaciones estándar debajo de su media y a 1 desviación estándar arriba de su media es igual a 0.81859. En otras palabras, la probabilidad de que la variable aleatoria x se encuentre entre 3 y 4.5 es igual a 0.81859.
Ejemplo de aplicación de la distribución de probabilidad normal estándar
Sea x una variable aleatoria continua normalmente distribuida, la cual de define como las horas de duración de un teléfono celular en condiciones normales de uso. Después de realizar pruebas, el fabricante estima una duración media de 20,000 horas de uso (μ =20,000) y una desviación estándar igual a 3,000 horas de uso (σ=3,000). ¿Cuál es la probabilidad de que los teléfonos celulares duren más de 25,000 horas, P(x>25,000)?
Comenzamos calculando z:

Dado este resultado respondemos la pregunta: ¿cuál es la probabilidad de que la variable aleatoria z sea mayor que 1.67, P(z>1.67)? Haciendo uso de las tablas, sabemos que la probabilidad de que z sea menor o igual a 1.67 es igual a 0.95254.

Por lo tanto, P(z>1.67) se calcula restando P(z≤1.67) de 1:

La probabilidad de que un teléfono celular dure 25,000 horas en condiciones normales de uso es igual a 0.04746. El fabricante ofrece una garantía relacionada con el tiempo de uso en condiciones normales de operación, ¿cuál debe ser la duración estipulada en la garantía si se desea que no más del 15% de los clientes la hagan efectiva?
Ahora, tenemos una probabilidad (0.15) y un valor de z desconocido, como las tablas proporcionan la probabilidad acumulada buscamos la probabilidad acumulada más cercana a 0.85 (1-0.15), la cual es 0.85083, luego identificamos los encabezados del reglón y columna correspondientes, resultando un valor z igual a 1.04. Entonces, podemos escribir que:

Luego, tenemos que:

No obstante, esta probabilidad se relaciona con el área que se encuentra debajo de la cola derecha de la curva normal, para que corresponda con el área debajo de la cola izquierda escribimos:

El valor de x que corresponde a z=-1.04, lo calculamos de la siguiente manera:

El umbral de la garantía para que no más del 15% de los clientes la hagan efectiva es igual a 16,880 horas de uso en condiciones normales de operación. Esto es, P(x<16,880)=0.15.
Aproximación normal a la distribución binomial
Un experimento binomial consiste en n ensayos idénticos e independientes, en cada ensayo existen dos posibles resultados, éxito o fracaso, la probabilidad de éxito se denota como p y es la misma para cada ensayo, luego la probabilidad de fracaso es igual a 1-p. La variable aleatoria binomial x se define como el número de éxitos en n ensayos.
En los casos en los que np≥5 y n(1-p)≥5, la distribución normal se utiliza para calcular una aproximación a las probabilidades binomiales. La media μ y desviación estándar σ de la distribución normal se calculan a partir de los parámetros binomiales como sigue:

Consideremos que una empresa envía a 800 clientes (n=800) un correo promocional. Por experiencia de campañas anteriores, la empresa sabe que solamente el 8% de los clientes responden (p=0.08). ¿Cuál es la probabilidad de que respondan 70 clientes? Lo que se desea hallar es la probabilidad binomial de que 70 clientes respondan al correo, P(x=70). Verificamos las condiciones para utilizar la aproximación normal:

Luego, aplicamos la aproximación normal:

Es importante recordar que la distribución binomial es una distribución discreta, mientras que la distribución normal es continua. En el caso de las distribuciones de probabilidad continua, la probabilidad se calcula como el área bajo la curva de la función de densidad de probabilidad, por lo que es necesario un factor de corrección por continuidad, se desea calcular P(x=70), pero para aproximar la probabilidad binomial mediante la distribución normal calculamos P(69.5≤x≤70.5). El factor de corrección por continuidad es el 0.5 que se resta y suma de 70. Ahora, calculamos el valor de la variable aleatoria estandarizada z:

Consultando las tablas de la probabilidad normal estándar tenemos que:

Luego, restamos la probabilidad de que z sea menor o igual a 0.72 de la probabilidad de que z sea menor o igual a 0.85:

La probabilidad de que 70 clientes contesten el correo es igual a 0.0381. Otra cuestión que le interesa a la empresa es la probabilidad de que 80 o menos clientes contesten el correo. Para aplicar el factor de corrección de continuidad sumamos 0.5 a 80, la probabilidad que buscamos es P(x≤80.5). Ahora, calculamos el valor de z:

Haciendo uso de las tablas de probabilidad normal estándar, tenemos que:

La probabilidad de que 80 o menos clientes contesten el correo es igual a 0.98422.
Uso de Excel para la distribución de probabilidad normal estándar
La función DISTR.NORM.ESTAND.N tiene dos argumentos, z corresponde al valor de la variable aleatoria normal estandarizada y acumulado es igual a 0 para calcular la probabilidad o a 1 para obtener la probabilidad acumulada. La siguiente imagen muestra la manera en que escribimos la fórmula en una hoja de Excel para calcular las probabilidades acumuladas dados algunos valores de z:

El resultado que se obtiene es el siguiente:

La función DISTR.NORM.N tiene cuatro argumentos, x es el valor de la variable aleatoria, media corresponde a μ, desv_estándar es la desviación estándar σ y acumulado es igual a 0 para calcular la probabilidad o a 1 para obtener la probabilidad acumulada. La siguiente imagen muestra la manera en que escribimos la fórmula en una hoja de Excel para la probabilidad de que los teléfonos celulares duren más de 25,000 horas:

Luego, el resultado es 0.04779, el cual es muy cercano al obtenido en los párrafos anteriores usando tablas.

La función INV.NORM.ESTAND tiene solamente un argumento, probabilidad corresponde a la probabilidad para la cual se buscar el valor de la variable aleatoria x. Esta función devuelve el inverso de la distribución normal estándar acumulativa. La siguiente imagen muestra la manera en que se escribieron las fórmulas en una hoja de Excel

La salida es la siguiente:

También es posible obtener la variable aleatoria x mediante la función INV.NORM, la cual tiene tres argumentos, probabilidad es la probabilidad asociada a la variable aleatoria x desconocida, media corresponde a μ y desv_estándar es la desviación estándar σ.

La salida que obtenemos en la hoja de Excel es la siguiente:
