Intervalos de confianza: diferencia media de dos muestras independientes e igual varianza
Intervalo de confianza para la diferencia de medias cuando las muestras son independientes
El modelo
Suponga que tenemos dos distribuciones normales y tomamos una muestra independiente de cada distribución. Además, asumimos que las dos desviaciones estándar de la población son iguales. Más precisamente, dejamos
![]() |
y
![]() |
Las medias de la población posiblemente podrían diferir y se desconoce la desviación estándar común.
Derivación del intervalo de confianza
Nos gustaría encontrar un intervalo que capture la diferencia de medias con un nivel de certeza prescrito. Es decir,
![]() |
![]() |
Para comenzar, primero derivamos la distribución para la siguiente estadística .
![]() |
En la fórmula de T , hemos definido:
![]() |
![]() |
y
![]() |
Primero observe que dado que tenemos dos muestras independientes de distribuciones normales separadas,
![]() |
y
![]() |
Ahora, con la ayuda del siguiente teorema, podemos establecer que T es una t variable aleatoria con n + m – 2 grados de libertad. En aras de la simplicidad, no probamos este teorema aquí.
Teorema: distribución estadística T
Suponga que una variable aleatoria T tiene una distribución t con d grados de libertad. Entonces,
![]() |
![]() |
![]() |
Como consecuencia de (2), (1) tiene una distribución t con n + m – 2 grados de libertad.
Ahora podemos usar este resultado para derivar un intervalo de confianza. Primero observe que
![]() |
es equivalente a
![]() |
Por lo tanto,
![]() |
Esto significa que el intervalo aleatorio
![]() |
![]() |
A continuación, ofrecemos dos ejemplos que muestran los cálculos necesarios para construir este intervalo de confianza en particular.
Ejemplos computacionales
Ejemplo 1
Los siguientes datos son promedios de bateo individuales para cada jugador en los equipos A y B. Se cree que el promedio de bateo de un jugador sigue una distribución normal. También se cree que la desviación estándar del equipo A es igual a la desviación estándar del equipo B.
Equipo A | Equipo B |
---|---|
0,264401556452649 0,286801353669725 0,285477015697106 0,263245548896302 0,249198170169402 |
0,268527147226923 0,267638531112898 0,290230447717040 0,263950507359841 0,282326574960753 |
Con base en la tabla anterior, construya un intervalo de confianza del 95% para la diferencia en los promedios de bateo. (Equipo A menos Equipo B)
Solución
Estamos construyendo un intervalo de confianza para el parámetro
![]() |
Dejamos que el Equipo A represente la muestra X y el Equipo B la muestra Y. A partir de los datos, calculamos las siguientes estadísticas de resumen:
![]() |
![]() |
Por lo tanto, la varianza de la muestra combinada es
![]() |
Los grados de libertad del estadístico T son 5 + 5 – 2 = 8 . También,
![]() |
Entonces el margen de error es
![]() |
El intervalo de confianza del 95% es entonces
![]() |
Ejemplo 2
Al gerente de una tienda le gustaría investigar la posibilidad de que un nuevo cajero tome o retenga los ingresos de la tienda. Compara el desempeño de este empleado por encima / por debajo del gráfico con otro empleado más confiable. Los importes por encima y por debajo se dan en la tabla que se muestra a continuación. Suponga que los montos por encima / por debajo de los empleados se distribuyen normalmente y que las dos distribuciones tienen desviaciones estándar iguales. También suponga que el historial de excedentes o deficiencias del empleado actual es independiente del historial de excedentes o deficiencias del empleado anterior. (Esto parecería razonable si estos dos sujetos no tuvieran contacto entre sí y sus períodos de empleo estuvieran separados por varios años).
Empleado actual | Ex empleado |
---|---|
0,77 0,04 1,18 1,96 1,90 2,30 -0,64 0,82 1,82 0,18 0,48 -0,27 -0,39 0,27 0,42 -0,59 0,57 0,70 1,10 0,73 |
0,32 -0,13 0,07 -0,07 -1,16 -0,51 0,84 0,16 0,63 -0,37 -0,95 1,19 0,36 -0,17 0,38 -1,15 1,09 -1,43 -0,32 2,57 1,02 -0,25 -1,27 -0,57 0,04 |
Deje que los datos del empleado actual sean la muestra X y los datos del empleado anterior sean la muestra Y. Construya un intervalo de confianza del 99% para la diferencia de medias. (Media de X menos Media de Y )
Solución
Las estadísticas resumidas son
![]() |
Luego calculamos la varianza de la muestra combinada y el valor crítico t correspondiente al límite de confianza del 99% :
![]() |
De esto, vemos que el margen de error del 99% es
![]() |
Esto da un intervalo de confianza de
![]() |
Equivalencia del intervalo de confianza con la prueba de hipótesis
Podemos usar el intervalo de confianza que hemos derivado para probar la hipótesis de que la diferencia de medias es cero. Es decir, nos gustaría probar
![]() |
usando la estadística de prueba
![]() |
Para una prueba con nivel de significancia
![]() |
la región de rechazo sería
![]() |
Cuando la hipótesis nula es verdadera, la probabilidad de no rechazar la hipótesis nula es
![]() |
Sin embargo,
![]() |
dónde
![]() |
y
![]() |
Ejemplos computacionales: revisados
Ejemplo 1
Recuerde que el intervalo de confianza del 95% para la diferencia de medias que encontramos es
![]() |
Dado que este intervalo contiene cero, no rechazaríamos la hipótesis nula de que la diferencia media es cero. (Al nivel de significancia del 5% ) Es decir, no podemos afirmar que el Equipo A tiene un promedio de bateo medio diferente al del Equipo B al nivel de significancia del 5% .
Ejemplo 2
Recuerde que el intervalo de confianza del 99% para la diferencia de medias que encontramos es
![]() |
Este intervalo no contiene cero, por lo que rechazaríamos la afirmación de que el nuevo empleado tiene el mismo rendimiento neto medio que el anterior. (Al nivel de significancia del 1% ) Hay una diferencia entre los dos empleados. De hecho, incluso rechazaríamos la hipótesis nula a favor de
![]() |
al nivel de significancia del 0,5% . ¡Esto sugiere fuertemente que el nuevo empleado está robando a la empresa! El ex empleado lo usamos como marco de referencia. En las ‘Preguntas del cuestionario’, le pedimos al lector que derive la fórmula del intervalo de confianza unilateral correspondiente a esta alternativa unilateral.
Resumen
Los supuestos clave para el intervalo de confianza T de dos muestras son:
yo. Las muestras se extraen de forma independiente.
ii. Ambas distribuciones son normales.
iii. Las dos distribuciones tienen desviaciones estándar iguales.
Si las condiciones i. hasta iii. se cumplen todos, entonces podemos usar el intervalo de confianza T de dos muestras. El intervalo de confianza de dos muestras es equivalente a la prueba de hipótesis bilateral de diferencia de medias cero. Por lo tanto, podemos utilizar alternativamente el intervalo de confianza para probar si la diferencia de medias es cero.
Articulos relacionados
- ¿Qué conflictos importantes ocurrieron durante la Edad Media en Italia?
- ¿Cómo era la Vida en Italia Durante la Edad Media?
- ¿Cómo Afectaron las Invasiones Germánicas a Italia en la Edad Media?
- ¿Cuál es la Diferencia entre el Calendario Gregoriano y el Juliano?
- ¿Cuál es la diferencia entre energía interna y entalpía?
- ¿Qué es un bosque seco y cómo se diferencia de un bosque húmedo?
- ¿Cómo era la vida cotidiana en la Edad Media española?
- ¿Cuál es la diferencia entre HMO y PPO?
- ¿Qué diferencia existe entre democracia y populismo?
- ¿Qué diferencia hay entre una democracia y una dictadura?