Menú Cerrar

Estimación por intervalo de la media poblacional

¿Qué es la estimación por intervalo?

Ya que los estimadores puntuales no proporcionan el valor exacto de un parámetro poblacional, la estimación por intervalo suma y resta una cantidad llamada margen de error: Estimador puntual ± Margen de error. Tanto la media poblacional como la proporción poblacional se pueden estimar por intervalo.

Estimación por intervalo de la media poblacional con desviación estándar conocida

Para calcular el margen de error se usa la desviación estándar poblacional σ, si esta no se conoce, se utiliza la desviación estándar muestral s. En ocasiones, se dispone de datos históricos con los que es posible calcular la desviación estándar poblacional, lo que no significa que se conozca con seguridad, sino que se tiene una buena estimación.

Cada semana, una tienda realiza un muestreo aleatorio simple de tamaño n=49. Sea x una variable aleatoria definida como la cantidad que los clientes gastan en cada visita. Considerando los datos históricos la desviación estándar poblacional es igual a $21 (σ=$21). Los muestreos previos indican que los datos se distribuyen normalmente. En el último estudio, se obtuvo una media muestral igual a $100 (x̄=$100), con la cual es posible realizar una estimación puntual de la media poblacional μ. Primero, calculamos el error estándar de la media muestral:

Sabemos que los datos están normalmente distribuidos, por lo que el 95% de los valores de la media muestral deben estar a no más de ±1.96σ de la media poblacional, lo que significa que el 95% de los valores de la media muestral están a no más de ±5.88 (±1.96×3=±5.88) de la media poblacional.

La estimación por intervalo de la media poblacional μ se realiza sumando y restando el margen de error (5.88) de la media muestral . El 95% de todos lo intervalos definidos por ±5.88 contendrán a la media poblacional, la razón es que el 95% de las medias muestrales se encuentran en la región no sombreada. Si, mediante muestreo aleatorio simple, se obtiene la media muestral 1, el intervalo 1±5.88 abarca la media poblacional. Empero, el intervalo 2±5.88 no contiene a la media poblacional. En otras palabras, se tiene 95% de confianza en que el intervalo ±5.88 contenga a la media poblacional. Se dice que este intervalo tiene un nivel de confianza de 95% y que el coeficiente de confianza es 0.95. Ya que la media muestral de la última semana es igual a $100, tenemos que:

El intervalo va de $94.12 a $105.88 y se conoce como intervalo de confianza de 95%. En general, la estimación por intervalo de una media poblacional μ con desviación estándar σ conocida está dada por la siguiente fórmula:

Donde, es la media muestral, 1-α es el coeficiente de confianza, zα/2 es el valor z para un área en la cola superior de la distribución de probabilidad normal estándar igual a α/2. Si el coeficiente de confianza es 0.95, α es igual a 0.05 (1-0.95=0.05), por lo que α/2=0.025, luego, de tablas se tiene que z0.025=1.96. De este modo, se obtuvo que el margen de error es igual a ±5.88:

Para un nivel de confianza igual a 99%, se tiene que z0.005=2.576 (Ver tablas), estimando por intervalos obtenemos:

Un mayor grado de confianza implica un mayor margen de error y amplitud del intervalo de confianza. Con un nivel de confianza de 99%, se ha obtenido un error igual a ±7.728, y un intervalo desde $92.272 a $107.728. Dado que el tamaño de la muestra aparece en el denominador de la fórmula para calcular el margen de error, un mayor tamaño de muestra se traduce en un margen de error más pequeño, un intervalo más estrecho y mayor precisión. Por último, el margen de error es el mismo para todas las muestras de tamaño n, esto se debe a que se conoce la desviación estándar poblacional.

Determinar el tamaño de la muestra

En una estimación por intervalo de la media poblacional, es posible determinar el tamaño de la muestra para obtener un margen de error deseado.

Donde, E es el margen de error. El tamaño de la muestra depende del nivel de confianza elegido, por ejemplo, para un nivel de confianza de 95% se tiene que z0.025=1.96. El valor de la desviación estándar poblacional σ puede ser un valor obtenido de estudios anteriores (ej. una muestra preliminar). Una estimación burda de la desviación estándar consiste en dividir el rango entre 4.

Consideremos que la administración de la tienda desea realizar un nuevo estudio, con la condición de que la media poblacional debe estimarse con un margen de error igual a $3 y con un nivel de confianza de 95%, esto último implica que z0.025=1.96.

Para obtener un margen de error igual a $3 y con un nivel de confianza de 95%, el tamaño de la muestra debe ser de por lo menos 189. Dado que el valor de n no es un número entero, se ha redondeado 188.24 al entero superior.

Estimación por intervalo de la media poblacional con desviación estándar desconocida

Cuando no se cuenta con una buena estimación de la desviación estándar poblacional σ, se utiliza la misma muestra para estimar tanto la media poblacional μ como la desviación estándar poblacional σ. Dado el caso, se usa la desviación estándar muestral s para estimar la desviación estándar poblacional σ. También se recurre a la distribución t, la cual es una familia de distribuciones de probabilidad con media igual a cero, además cada distribución t se relaciona con un número de grados de libertad. Así, se tiene una distribución t para un grado de libertad, otra para dos grados de libertad, etc. La diferencia entre la distribución t y la distribución normal estándar se reduce conforme el número de grados de libertad de la distribución t aumenta. También, a mayor número de grados de libertad de la distribución t menor variabilidad.

El valor de t que corresponde a un área igual a α/2 en la cola superior de la distribución t se denota como tα/2. Conforme el número de grados de libertad aumenta, t0.025 se aproxima a z0.025=1.96, de tal manera que, para más de 100 grados de libertad, el valor z proporciona una buena aproximación al valor t.

La estimación por intervalo de la media poblacional μ con desviación estándar desconocida está dada por la siguiente fórmula:

Donde, s es la desviación estándar muestral, 1-α es el coeficiente de confianza, tα/2 es el valor t que corresponde a un área en la cola superior de la distribución t igual a α/2 para n-1 grados de libertad.

Tabla de la distribución t

Para conocer el área en la cola superior de la distribución t se utilizan tablas, por ejemplo, el valor t0.05 corresponde a un 90% de confianza, y para 7 grados de libertad, se tiene que t0.05=1.895. De manera similar, el valor t0.01 corresponde a un 98% de confianza, y para 19 grados de libertad, se tiene que t0.01=2.539. Los valores tα/2 se encuentran buscando el renglón que corresponde a los grados de libertad y la columna que corresponde a α/2.

Ejemplo estimación por intervalo de la media poblacional con desviación estándar desconocida

Consideremos que una tienda realiza un muestro aleatorio simple de tamaño n=51, donde x es una variable aleatoria definida como la cantidad que los clientes gastan en cada visita. En este estudio, se obtuvo una media muestral igual a $100 (=$100), pero se desconoce la desviación estándar poblacional σ. Al calcular la desviación estándar muestral se obtiene:

El siguiente paso es consultar la tabla de la distribución t para determinar el valor de t0.025 que corresponde a un 95% de confianza y 50 grados de libertad (n-1=50), el cual resulta 2.009. Enseguida, calculamos la estimación por intervalo de la media poblacional:

La estimación puntual de la media poblacional es igual a $100 y el margen de error es igual a $3.77, por lo que el intervalo de confianza de 95% va de $96.23 a $103.77. Esto significa que el gasto de cada cliente por visita se encuentra entre $96.23 y $103.77 para un nivel de confianza de 95%.

Finalmente, el margen de error varía entre muestras, pues depende de la desviación estándar muestral s, es grande cuando s es grande y es pequeño cuando s es pequeña. Además, si la distribución de la población es muy sesgada, se deben usar muestras más grandes.

Uso de Excel para la estimación por intervalo la media poblacional

La función INTERVALO.CONFIANZA.NORM devuelve el intervalo de confianza para la media poblacional cuando los datos están normalmente distribuidos. Tiene tres argumentos, alfa es el nivel de significancia, si se elige α=0.05, el nivel de confianza es igual a 95%; desv_estándar es la desviación estándar poblacional —en el caso que se supone conocida—; y tamaño es el tamaño de la muestra.

Por otro lado, INTERVALO.CONFIANZA.T devuelve el intervalo de confianza para la media poblacional con una distribución t de Student. Tiene tres argumentos, alfa es el nivel de significancia, si se elige α=0.05, el nivel de confianza es igual a 95%; desv_estándar es la desviación estándar poblacional; y tamaño es el tamaño de la muestra.

En la siguiente imagen, se muestra la manera de escribir ambas funciones para calcular el intervalo de confianza con un nivel de significancia igual a 0.05. En el primer caso, se considera que los datos están normalmente distribuidos, con desviación estándar poblacional igual a 21 y un tamaño de muestra igual a 49. En el segundo caso, se usa la función que corresponde a una distribución t de Student, con desviación estándar poblacional igual a 13.4 y un tamaño de muestra igual a 51.

Los resultados son los que se han obtenido en los ejemplos desarrollados en los párrafos anteriores.

Otra alternativa es seleccionar la cinta Datos, seleccionar Análisis de datos, dar clic sobre la opción Estadística descriptiva, dar clic en Aceptar, ingresar las celdas que contienen los datos en Rango de entrada, seleccionar Agrupado por columnas o Agrupado por filas según sea el caso, seleccionar Rótulos en el primer renglón si el Rango de entrada incluye el encabezado, seleccionar el Rango de salida (ej. En una hoja nueva, En un libro nuevo), seleccionar la opción Resumen de estadísticas, seleccionar la opción Nivel de confianza para la media e ingresar un valor (ej. 95, 99), por último dar clic en Aceptar.

Los resultados se mostrarán en el rango de salida que se haya especificado.

Cómo citar

García, Miguel. (28 abril 2025). Estimación por intervalo de la media poblacional. Celeberrima.com. Última actualización el 30 abril 2025.