Intervalos de confianza: diferencia media de dos muestras independientes e igual varianza

Publicado el 23 noviembre, 2020

Intervalo de confianza para la diferencia de medias cuando las muestras son independientes

El modelo

Suponga que tenemos dos distribuciones normales y tomamos una muestra independiente de cada distribución. Además, asumimos que las dos desviaciones estándar de la población son iguales. Más precisamente, dejamos

Muestra 1

y

Muestra 2

Las medias de la población posiblemente podrían diferir y se desconoce la desviación estándar común.

Derivación del intervalo de confianza

Nos gustaría encontrar un intervalo que capture la diferencia de medias con un nivel de certeza prescrito. Es decir,

Desigualdad de probabilidad

explicación de A y B y alfa

Para comenzar, primero derivamos la distribución para la siguiente estadística .

Fórmula T

En la fórmula de T , hemos definido:

Explicación de la varianza agrupada

Medios de muestra

y

diferencia de medias delta

Primero observe que dado que tenemos dos muestras independientes de distribuciones normales separadas,

igualdad en la distribución para Z

y

Distribución de variaciones de la muestra

Ahora, con la ayuda del siguiente teorema, podemos establecer que T es una t variable aleatoria con n + m – 2 grados de libertad. En aras de la simplicidad, no probamos este teorema aquí.

Teorema: distribución estadística T

Suponga que una variable aleatoria T tiene una distribución t con d grados de libertad. Entonces,

Igualdad de distribución para T

Independencia

Distribución de variables de razón

Como consecuencia de (2), (1) tiene una distribución t con n + m – 2 grados de libertad.

Ahora podemos usar este resultado para derivar un intervalo de confianza. Primero observe que

Declaración uno equivalencia

es equivalente a

Intervalo de confianza

Por lo tanto,

Fórmula del intervalo de confianza

Esto significa que el intervalo aleatorio

Intervalo aleatorio para diferencia de medias

Interpretación de intervalo aleatorio

A continuación, ofrecemos dos ejemplos que muestran los cálculos necesarios para construir este intervalo de confianza en particular.

Ejemplos computacionales

Ejemplo 1

Los siguientes datos son promedios de bateo individuales para cada jugador en los equipos A y B. Se cree que el promedio de bateo de un jugador sigue una distribución normal. También se cree que la desviación estándar del equipo A es igual a la desviación estándar del equipo B.

Equipo A Equipo B
0,264401556452649
0,286801353669725
0,285477015697106
0,263245548896302
0,249198170169402
0,268527147226923
0,267638531112898
0,290230447717040
0,263950507359841
0,282326574960753

Con base en la tabla anterior, construya un intervalo de confianza del 95% para la diferencia en los promedios de bateo. (Equipo A menos Equipo B)

Solución

Estamos construyendo un intervalo de confianza para el parámetro

Notación de diferencias, por ejemplo 1

Dejamos que el Equipo A represente la muestra X y el Equipo B la muestra Y. A partir de los datos, calculamos las siguientes estadísticas de resumen:

Ejemplo de medias Ejemplo 1

Resumen de estadísticas Ejemplo 1

Por lo tanto, la varianza de la muestra combinada es

Ejemplo agrupado 1

Los grados de libertad del estadístico T son 5 + 5 – 2 = 8 . También,

Ejemplo de valor crítico 1

Entonces el margen de error es

Ejemplo de margen de error 1

El intervalo de confianza del 95% es entonces

Ejemplo de intervalo de confianza 1

Ejemplo 2

Al gerente de una tienda le gustaría investigar la posibilidad de que un nuevo cajero tome o retenga los ingresos de la tienda. Compara el desempeño de este empleado por encima / por debajo del gráfico con otro empleado más confiable. Los importes por encima y por debajo se dan en la tabla que se muestra a continuación. Suponga que los montos por encima / por debajo de los empleados se distribuyen normalmente y que las dos distribuciones tienen desviaciones estándar iguales. También suponga que el historial de excedentes o deficiencias del empleado actual es independiente del historial de excedentes o deficiencias del empleado anterior. (Esto parecería razonable si estos dos sujetos no tuvieran contacto entre sí y sus períodos de empleo estuvieran separados por varios años).

Empleado actualEx empleado
0,77
0,04
1,18
1,96
1,90
2,30
-0,64
0,82
1,82
0,18
0,48
-0,27
-0,39
0,27
0,42
-0,59
0,57
0,70
1,10
0,73
0,32
-0,13
0,07
-0,07
-1,16
-0,51
0,84
0,16
0,63
-0,37
-0,95
1,19
0,36
-0,17
0,38
-1,15
1,09
-1,43
-0,32
2,57
1,02
-0,25
-1,27
-0,57
0,04

Deje que los datos del empleado actual sean la muestra X y los datos del empleado anterior sean la muestra Y. Construya un intervalo de confianza del 99% para la diferencia de medias. (Media de X menos Media de Y )

Solución

Las estadísticas resumidas son

Resumen de estadísticas Ejemplo 2

Luego calculamos la varianza de la muestra combinada y el valor crítico t correspondiente al límite de confianza del 99% :

Ejemplo 2 agrupado y CV

De esto, vemos que el margen de error del 99% es

ME Ejemplo 2

Esto da un intervalo de confianza de

Ejemplo 2 de CI

Equivalencia del intervalo de confianza con la prueba de hipótesis

Podemos usar el intervalo de confianza que hemos derivado para probar la hipótesis de que la diferencia de medias es cero. Es decir, nos gustaría probar

Prueba de hipotesis

usando la estadística de prueba

Estadística de prueba

Para una prueba con nivel de significancia

Nivel significativo

la región de rechazo sería

Región de rechazo

Cuando la hipótesis nula es verdadera, la probabilidad de no rechazar la hipótesis nula es

No rechazar bajo Ho

Sin embargo,

Equivalencia al intervalo de confianza

dónde

Límite inferior

y

Superior

Ejemplos computacionales: revisados

Ejemplo 1

Recuerde que el intervalo de confianza del 95% para la diferencia de medias que encontramos es

Ejemplo 1 de CI

Dado que este intervalo contiene cero, no rechazaríamos la hipótesis nula de que la diferencia media es cero. (Al nivel de significancia del 5% ) Es decir, no podemos afirmar que el Equipo A tiene un promedio de bateo medio diferente al del Equipo B al nivel de significancia del 5% .

Ejemplo 2

Recuerde que el intervalo de confianza del 99% para la diferencia de medias que encontramos es

Ejemplo 2 CI

Este intervalo no contiene cero, por lo que rechazaríamos la afirmación de que el nuevo empleado tiene el mismo rendimiento neto medio que el anterior. (Al nivel de significancia del 1% ) Hay una diferencia entre los dos empleados. De hecho, incluso rechazaríamos la hipótesis nula a favor de

Alternativa unilateral

al nivel de significancia del 0,5% . ¡Esto sugiere fuertemente que el nuevo empleado está robando a la empresa! El ex empleado lo usamos como marco de referencia. En las ‘Preguntas del cuestionario’, le pedimos al lector que derive la fórmula del intervalo de confianza unilateral correspondiente a esta alternativa unilateral.

Resumen

Los supuestos clave para el intervalo de confianza T de dos muestras son:

yo. Las muestras se extraen de forma independiente.

ii. Ambas distribuciones son normales.

iii. Las dos distribuciones tienen desviaciones estándar iguales.

Si las condiciones i. hasta iii. se cumplen todos, entonces podemos usar el intervalo de confianza T de dos muestras. El intervalo de confianza de dos muestras es equivalente a la prueba de hipótesis bilateral de diferencia de medias cero. Por lo tanto, podemos utilizar alternativamente el intervalo de confianza para probar si la diferencia de medias es cero.

¡Puntúa este artículo!