Prueba de hipótesis para una diferencia entre dos proporciones

Publicado el 11 noviembre, 2020

Dimensiones

¿Es la proporción de personas de 30 años que poseen una casa mayor que la proporción de personas de 40 años que poseen una casa? ¿Existe alguna diferencia en la proporción de graduados universitarios que poseen un automóvil y la proporción de desertores universitarios que no poseen un automóvil? ¿Cómo podemos saber si hay alguna diferencia? Para ello, recurrimos a la prueba de hipótesis para averiguar si existe o no una diferencia entre dos proporciones.

Prueba de proporciones e hipótesis

Primero, comencemos con una pequeña sopa de letras. En la pantalla hay una ecuación (ver video). Se lee así: p hat es igual ax sobre n . p es la proporción muestral que usamos para estimar la proporción poblacional, que es simplemente p . n es el tamaño de nuestra muestra y x es el número de unidades o individuos que representan la característica que más nos interesa.

Entonces, por ejemplo, digamos que en una muestra de 50 personas mayores de 60 años, 10 tienen cáncer. Esto significa que nuestra proporción de muestra, p hat , es igual a 10/50, que es 1/5, o 0.20. Eso fue simple. Construyamos sobre esto.

Cuando intentamos averiguar si hay una diferencia entre dos proporciones de población, denominadas p_1 y p_2 , debemos plantear hipótesis. Son los siguientes:

  • La hipótesis nula , H-nada (H_0), nos dice que p_1 es igual a p_2
  • La hipótesis alternativa , H_A, nos dice que p_1 no es igual a p_2

Es fácil recordar que este es el caso si se piensa en el sistema de justicia de los Estados Unidos. Si te arrestan por algo, la hipótesis nula es que eres inocente hasta que se demuestre lo contrario. Eres igual a bueno; esa es la hipótesis nula. Depende de la fiscalía refutar esto. No es igual al bien: la hipótesis alternativa.

Bueno. Suficientemente simple. Dado que estamos tratando con dos proporciones, es muy lógico ver que usamos p hat_1 = x_1 / n_1 para estimar p_1 . Asimismo, usamos p hat_2 = x_2 / n_2 para estimar p_2 . Nuevamente, todo lo que esto dice es que usamos la proporción muestral respectiva de cada población ( p hat ) para estimar su propia proporción poblacional ( p ).

Debido a que no sabemos qué son realmente p_1 y p_2 , podemos llegar a una estimación ponderada de p con la siguiente fórmula (ver video). Y el error estándar se puede encontrar usando la siguiente fórmula (ver video). El error estándar es básicamente una medida de cuán variable puede ser la media muestral en diferentes muestras de una población determinada. Tenga en cuenta la q en la fórmula más reciente. Recuerda que q = 1 – p para más adelante.

Probablemente estés realmente confundido por todos estos números y letras y quién sabe qué. Entonces, déjeme simplificar todo lo que necesita saber sobre el uso de una prueba z para averiguar la diferencia entre dos proporciones de población usando la siguiente imagen maestra (ver video). Esto también parece intimidante, pero prometo que no lo es. Todo lo que esto realmente está diciendo es que el valor de prueba, z , es igual al valor observado ( p hat_1p hat_2 ) – el valor esperado ( p_1p_2 ) todo dividido por el error estándar. Eso es.

Para usar la prueba z para encontrar la diferencia entre dos proporciones, debemos satisfacer dos requisitos:

  1. Las muestras deben ser independientes
  2. n_1 * p_1 , n_1 * q_1 , n_2 * p_2 y n_2 * q_2 tienen que ser mayores o iguales a 5

Ejemplo

Nuevamente, sé que todas esas ecuaciones, fórmulas y símbolos te han hecho girar la cabeza, pero centrémonos en la imagen maestra y en un ejemplo en el que todo lo que tienes que hacer es básicamente conectar y tragar.

Estos son los pasos que debe seguir para resolver nuestro ejemplo:

Paso 1: expresa tu hipótesis

Paso 2: encuentre sus valores críticos

Paso 3: Calcule el valor de la prueba

Paso 4: Tome su decisión: ¿rechaza o no rechaza la hipótesis nula?

Paso 5: resuma sus resultados

Este es nuestro ejemplo. En un estudio reciente (totalmente inventado por cierto), se demostró que 100 de 250 ciudades de tendencia republicana tenían una tasa de disparos accidentales de menos del 10%, mientras que 50 de 350 ciudades de tendencia demócrata tenían una tasa de disparos accidentales. de menos del 10%. Usando un nivel de significancia de 0.05, continúe y pruebe la afirmación de que no hay diferencia en las proporciones de las ciudades de tendencia republicana y demócrata con una tasa de disparos accidentales de menos del 10%.

Vamos a ir al grano. Sea p hat_1 igual a las ciudades de tendencia republicana y p hat_2 igual a las ciudades de tendencia demócrata.

Esto significa:

  • p hat_1 = x_1 / n_1 = 100/250 = 0.40
  • p hat_2 = x_2 / n_2 = 50/350 = 0.14

La estimación ponderada de p , ( x_1 + x_2 ) / ( n_1 + n_2 ) es igual a:

(100 + 50) / (250 + 350) = 0,25

y la estimación ponderada de q es igual a 1 – p o 1 – 0,25 = 0,75.

Sabiendo todo esto de nuestra imagen maestra, ¡vamos!

Paso 1: expresa tu hipótesis

  • La hipótesis nula , H-nada, nos dice que p_1 es igual a p_2
  • La hipótesis alternativa , H_A, nos dice que p_1 no es igual a p_2

Paso 2: encuentre sus valores críticos

Los valores críticos para 0.05 se pueden encontrar en una tabla al final de un libro de estadísticas. Dado que tienen derechos de autor, no puedo mostrarles uno en pantalla, pero los valores críticos son -1,96 y 1,96 para este nivel de significación. Eso significa que cualquier valor de prueba mayor que 1,96 o menor que -1,96 nos obligará a rechazar la hipótesis nula.

Paso 3: Calcule el valor de la prueba

Aquí es donde ingresamos todos nuestros números en la ecuación de nuestra imagen maestra.

Para el numerador, tenemos:

( p hat_1p hat_2 ) = 0.40-0.14 = 0.26

( p_1p_2 ) = 0, porque p_1 = p_2 de nuestro H-cero; ergo p_1p_2 = 0. Esto significa que nuestro numerador es igual a 0,26.

Para el denominador, tenemos: la estimación ponderada de p = 0,25 y la estimación ponderada de q = 0,75. n_1 = 250 y n_2 = 350.

Por lo tanto, nuestro denominador se lee como:

Raíz cuadrada de ((0.25) (0.75) (1/250 + 1/350)) = 0.036

Poniendo todo junto, obtenemos 0,26 / 0,036, para obtener una respuesta de: z = 7,22. La respuesta real es alrededor de 7.17, pero debido a que redondeamos, obtuvimos una respuesta ligeramente más alta, lo que no afectará nuestra decisión en ningún caso.

Paso 4: Tome su decisión: ¿rechaza o no rechaza la hipótesis nula?

7,22> 1,96. Por tanto, rechazamos la hipótesis nula.

Paso 5: resuma sus resultados

Existe una cantidad adecuada de pruebas para rechazar la afirmación de que no hay diferencia en las proporciones de ciudades de tendencia republicana y demócrata con una tasa de disparos de menos del 10%.

Resumen de la lección

Resumamos todo lo que aprendimos. Podemos usar la prueba z para ayudarnos a determinar si hay una diferencia entre dos proporciones usando cinco pasos clave:

Paso 1: expresa tu hipótesis

Paso 2: encuentre sus valores críticos

Paso 3: Calcule el valor de la prueba

Paso 4: Tome su decisión: ¿rechaza o no rechaza la hipótesis nula?

Paso 5: resuma sus resultados

Recuerda:

  • La hipótesis nula , H-nada, nos dice que p_1 es igual a p_2
  • La hipótesis alternativa , H_A, nos dice que p_1 no es igual a p_2

Y no olvide que para usar la prueba z en este escenario:

  1. Las muestras deben ser independientes
  2. n_1 * p_1 , n_1 * q_1 , n_2 * p_2 y n_2 * q_2 tienen que ser mayores o iguales a 5

¡Ahora tiene suficiente información para resolver estos problemas por su cuenta!

¡Puntúa este artículo!