La relación entre los intervalos de confianza y las pruebas de hipótesis

¿Quieres explorar más? 📂 Explorar Categorías 🔥 Tendencias 🎓 Cursos

Prueba de una pequeña muestra

Las uvas tienen muchos usos. Una lista parcial incluye uvas Cabernet para vino, uvas Thompson para comer crudas, uvas Concord para jugos y uvas moscatel para pasas. Los productores suelen utilizar el peso de la uva como referencia de calidad. Imagínese trabajar con el Sr. Muscato, el propietario de una importante empresa de distribución de uva moscatel. Quiere hacer un seguimiento del peso de la uva mientras sus uvas todavía están creciendo en los huertos. Obviamente, recolectar todas las uvas y medir cada una no es práctico. Estudiar una muestra del cultivo es el camino a seguir.

Las uvas de los huertos son la población en estudio. Queremos estimar el peso medio de esta población de uvas. No conocemos este número, ni conocemos su desviación estándar. Tomando una pequeña cantidad (menos de 30) de cajas de envío llenas de uvas, podemos medir el peso de cada caja de uvas. Muscato nos dice que el peso ideal para una caja de uvas debe ser de 41,5 libras.

En esta lección, no entraremos en detalles sobre cómo encontrar un intervalo de confianza o realizar pruebas de hipótesis . Si no está familiarizado con alguno de los temas, no dude en explorar nuestras otras lecciones que cubren cada concepto con mayor detalle. En cambio, exploraremos lo que dicen las matemáticas detrás de cada concepto y cómo se relacionan los dos. Además, es agradable estar en compañía del Sr. Muscato; siempre hay un cuenco de pasas cerca.

Configuración de la prueba de hipótesis

Imagine que tomamos una muestra N = 12 cajas de uvas y encontramos que el peso medio = 43.5 libras con una desviación estándar de la muestra = 3.947 libras. ¿Es esto lo suficientemente cerca del peso medio ideal de 41,5 libras?

En la prueba de hipótesis, establecemos una hipótesis nula . En concreto, elegimos como hipótesis nula H o : la media de la población μ = 41,5. Básicamente, esta hipótesis nula afirma que no hay una diferencia significativa entre el peso medio de la población y el peso medio ideal, lo que sería una buena noticia para Muscato.

Tema relacionado:
¿Cómo fue la relación entre España y Portugal en el siglo XX?

Complementando la hipótesis nula está la hipótesis alternativa H a : μ no es igual a 41,5. Hay dos direcciones en la hipótesis alternativa para las cuales μ puede no ser igual a 41,5. Podría ser menor o mayor que 41,5, por lo que realizaremos una prueba de dos caras.

Esperamos no rechazar la hipótesis nula. De lo contrario, podríamos tener que modificar el proceso de crecimiento. El Sr. Muscato nos recuerda que se desconoce la desviación estándar de la población y que el tamaño de la muestra es pequeño. En otras palabras, podemos asociar la media con una distribución t para realizar nuestra prueba de hipótesis.

Primero, necesitamos elegir un nivel de significancia , la probabilidad de rechazar la hipótesis nula cuando es cierta, generalmente escrita como α. Vamos con α = 0.05. Esto significa que existe el riesgo de que el 5% de las veces concluyamos erróneamente que existe una diferencia (rechacemos nuestra hipótesis nula) cuando no hay una diferencia real.

Luego, encontramos el puntaje t para α / 2 (ya que esta es una prueba de dos lados) y podemos usarlo para encontrar un valor p . Esta es una probabilidad basada en la media muestral. Si el valor p es menor o igual a α decidimos rechazar la hipótesis nula. Si el valor p es mayor que α, no rechazamos la hipótesis nula.

Todo lo que podemos hacer con una hipótesis nula es rechazarla o dejar de rechazarla. No podemos probar la hipótesis nula. Mientras el Sr. Muscato ronda cerca, encontramos que nuestro valor p = 0.1060. Esto es mayor que α de .05, por lo que no rechazamos la hipótesis nula. Esto nos da cierto estímulo para la calidad de las uvas, pero podemos ir más allá calculando el intervalo de confianza. ¿Listo para otro plato de pasas?

Tema relacionado:
¿Qué relación tuvo Portugal con el Imperio español?

Desarrollando el intervalo de confianza

Usando la desviación estándar de la muestra, el número de casillas en la muestra, la puntuación t α / 2 y la media de la muestra, podemos construir un intervalo de confianza. Recuerde que un intervalo de confianza es un rango de valores que también expresa la incertidumbre asociada con un parámetro de población. Si μ = 41,5 de la hipótesis nula está dentro del intervalo de confianza, no rechazamos la hipótesis nula. Asimismo, si el valor de la hipótesis nula está fuera del intervalo de confianza, rechazamos la hipótesis nula.

Usando los valores de nuestra prueba de hipótesis, encontramos que el intervalo de confianza IC es [41 46]. Claramente, 41,5 está dentro de este intervalo, por lo que no rechazamos la hipótesis nula. Esto concuerda con los resultados de nuestra prueba de hipótesis. Tenemos un 95% de confianza en que el peso medio de la población está entre 41 y 46 libras.

Ésta es una buena noticia porque el intervalo contiene el peso medio ideal. Para celebrar, el Sr. Muscato ofrece vino gratis para acompañar las pasas. Sin embargo, tenga cuidado con la cantidad que bebe; ¡aún necesitamos relacionar los intervalos de confianza con las pruebas de hipótesis con mayor detalle!

Relacionar la importancia y el valor P con los intervalos de confianza

¿Qué sucede si mantenemos todo lo demás igual pero reelaboramos el intervalo de confianza CI para niveles α de .10 y .20? Recuerde que α es una probabilidad. Las probabilidades tienen valores entre 0 y 1. El nivel de confianza es 1 – α. A medida que la probabilidad α aumenta de 0 a 1, el nivel de confianza disminuye de 1 a 0. Observe algunos IC y valores p con diferentes niveles de significancia α:

Observaciones? El intervalo de confianza se vuelve más estrecho a medida que el nivel de confianza disminuye del 95% al 90% al 80%. ¿Esto tiene sentido? ¿Cómo pueden parecer que los intervalos se vuelven más precisos mientras el nivel de confianza empeora? Podemos tomar un caso extremo para explicar esto. ¿Qué pasa si el intervalo contiene todos los números posibles para la media poblacional? Este intervalo sería excepcionalmente amplio, ya que tendría que ir de 0 a infinito para incluir todos los números posibles.

Tema relacionado:
¿Cuál es la relación de Estados Unidos con China?

Estaríamos 100% seguros de que cada vez que tomamos una muestra, la media de la población estaría contenida en la muestra, pero Muscato podría cuestionar la utilidad de estar 100% seguro de que el peso de las uvas está entre 0 e infinito. Un compromiso típico es elegir α = 0.05 correspondiente a un intervalo de confianza del 95%.

Observe las ecuaciones que conducen a 41 y 46 en el intervalo de confianza del 95%, donde x-bar es la media muestral:

Una desviación estándar de la muestra más pequeña ( s ) puede hacer que el estrecho intervalo, ya que esto implica una menor variación entre los valores medidos y la media de la muestra. Además, un número mayor ( N ) de elementos en la muestra puede reducir el intervalo de confianza (aunque el número generalmente se mantiene por debajo de 30).

¿Qué pasa con el valor p de nuestra prueba de hipótesis? Se mantuvo igual. El valor p depende de N , la media de la muestra y la distribución t, pero no depende de α. La decisión de la prueba de hipótesis, sin embargo, depende mucho de las comparaciones con α. Observe que para el caso del nivel de confianza del 80%, el valor p es menor que α. Rechazaríamos la hipótesis nula diciendo efectivamente que la media poblacional μ no es 41.5. Esto es maravillosamente consistente con el intervalo de confianza CI: [41,95 45,05] que no contiene el valor 41,5. A medida que aumenta el nivel de significancia α, es más probable que tengamos un valor p menor que α y rechacemos la hipótesis nula.

Tanto el resultado del valor p como el enunciado del intervalo de confianza son consistentes en rechazar la hipótesis nula o no rechazar la hipótesis nula. Sin embargo, una cosa que no debe rechazarse es el vino gratis del Sr. Muscato.

Resumen de la lección

Aprender algo sobre una población probando una pequeña muestra de la población, es la motivación para la prueba de hipótesis y los intervalos de confianza . Una hipótesis nula puede afirmar que no hay diferencia entre un parámetro de población y el valor hipotético. Las pruebas de hipótesis sirven para rechazar o no rechazar la hipótesis nula. La hipótesis alternativa es el complemento de la hipótesis nula.

Cuando no conocemos la desviación estándar de la media poblacional y el tamaño de la muestra es pequeño, podemos usar la distribución t. Por ejemplo, calculamos la media y la desviación estándar. Un valor p es un valor de probabilidad basado en la media de la muestra. Un nivel de significancia elegido α se compara con el valor p. Si el valor p es menor o igual a α decidimos rechazar la hipótesis nula. Si el valor p es mayor que α, no rechazamos la hipótesis nula.

Relacionado con α está el nivel de confianza , que es 1 – α. Además de la comparación del valor p, podemos construir un intervalo de confianza. Si el valor de la hipótesis nula está dentro del intervalo de confianza, no rechazamos la hipótesis nula. Si los valores de la hipótesis nula quedan fuera del intervalo de confianza, rechazamos la hipótesis nula.

A medida que aumenta el nivel de significancia, la amplitud del intervalo de confianza disminuye y es más probable que rechacemos la hipótesis nula. Esto es consistente con la comparación del valor p porque, a medida que aumenta el nivel de significancia α, es más probable que tengamos un valor p menor que α y, por lo tanto, es más probable que rechacemos la hipótesis nula.

Twittear

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo Editor y fundador