¿Qué es la prueba de hipótesis? – Definición, pasos y ejemplos

Publicado el 15 septiembre, 2020 por Rodrigo Ricardo

Definición

En esta lección, hablaremos sobre lo que se necesita para crear una prueba de hipótesis adecuada . Definimos prueba de hipótesis como los procedimientos formales que usan los estadísticos para probar si una hipótesis puede ser aceptada o no. Una hipótesis es una suposición sobre algo. Por ejemplo, una hipótesis sobre las mascotas de la familia podría ser algo así como que el número promedio de perros por hogar estadounidense es dos.

La prueba de hipótesis consiste en probar para ver si la hipótesis establecida es aceptable o no. Durante nuestra prueba de hipótesis, queremos recopilar tantos datos como podamos para poder probar nuestra hipótesis de una forma u otra. Existe un método adecuado de cuatro pasos para realizar una prueba de hipótesis adecuada:

  1. Escribe la hipótesis
  2. Crea un plan de análisis
  3. Analiza los datos
  4. Interpreta los resultados

Vamos a ver. Pero primero, conozcamos a Sam. Sam tiene una hipótesis que quiere probar. Sam trabaja como investigador en la Administración Nacional de Alimentos. Él es el que sale y prueba la comida que comemos para asegurarse de que sea segura. Veamos cómo sigue el método de los cuatro pasos.

Paso uno: hipótesis

El primer paso es el de redactar la hipótesis. De hecho, tienes dos hipótesis para escribir. Una se llama hipótesis nula . Ésta es la hipótesis basada en el azar. Piense en esto como la hipótesis que establece cómo esperaría que las cosas funcionen sin ningún factor externo que lo cambie. La otra hipótesis se llama hipótesis alternativa . Ésta es la hipótesis que muestra un cambio de la hipótesis nula que es causado por algo.

En la prueba de hipótesis, solo probamos para ver si nuestros datos se ajustan a nuestra hipótesis alternativa o si se ajustan a la hipótesis nula. No nos preocupamos por qué está causando que nuestros datos se desvíen de la hipótesis nula si lo hace. Tenga en cuenta que, al escribir su hipótesis nula y su hipótesis alternativa, deben escribirse de tal manera que si la hipótesis nula es falsa, la hipótesis alternativa es verdadera y viceversa.

¿Qué hace Sam aquí? La hipótesis nula de Sam es que toda la carne que se vende a los supermercados tiene menos de 48 horas. La hipótesis alternativa de Sam es que toda la carne que se vende a los supermercados tiene más de 48 horas. Como puede ver, si la hipótesis nula es falsa, entonces la hipótesis alternativa es verdadera.

Paso dos: plan de análisis

El segundo paso es crear un plan de análisis. Esto implica decidir cómo leer sus resultados para saber si su hipótesis nula es verdadera o si su hipótesis alternativa es verdadera. Por lo general, esto implica analizar solo una estadística de prueba.

Hay dos formas de leer los resultados: el método del valor P y el método de la región de aceptación. El valor P es la probabilidad de observar la estadística deseada. Si este valor P es menor que el nivel de significancia, entonces la hipótesis nula no es válida. El nivel de significancia es la probabilidad de cometer el error de decir que la hipótesis nula no es válida cuando en realidad es cierta. La región de aceptación es un rango de valores elegido que da como resultado que la hipótesis nula se declare válida.

Para este paso, Sam decide analizar sus datos utilizando la región de aceptación. La estadística que Sam decide usar es la cantidad de horas que la carne se vende a los supermercados. Sam va a varios proveedores de carne y comprueba la edad de la carne que se vende. Luego analiza esta estadística para ver cuántos proveedores de carne envían carne en menos de 48 horas. La región de aceptación es del 99% o más. Esto significa que si el 99% o más de los productores de carne envían su carne a tiempo, entonces la hipótesis nula es válida.

Paso tres: análisis de datos

El tercer paso es el de analizar los datos. Es poner en acción el segundo paso. Es en este paso que se analizan los datos y se encuentra un valor P o se encuentra la región de los datos.

Es en este paso que Sam verifica sus datos para ver cuántos de sus productores de carne están enviando sus carnes en 48 horas. Sam mira sus datos y ve que el 99,9% de los productores de carne están enviando sus carnes en 48 horas.

Paso cuatro: interpretación

El cuarto paso consiste en interpretar los resultados. Es en este paso que los datos se comparan con la región de aceptación o el nivel de significancia. Si el valor P es menor que el nivel de significancia, entonces la hipótesis nula no es válida. Si los datos están dentro de la región de aceptación, entonces la hipótesis nula es válida.

Sam mira estos datos. Sus datos muestran que la región de los datos está al 99,9%. Lo compara con su aceptable 99%. ¿Es el 99,9% más alto que el 99%? Es. Esto significa que sus datos están dentro de la región de aceptación. Esto le dice a Sam que puede decir que la hipótesis nula es válida. Ahora, tiene los datos para probar su declaración de hipótesis nula. Esto es lo que quería que sucediera. Quería poder decirle a la gente que sus productores de carne están enviando carne fresca que tiene menos de 48 horas.

Ejemplo

Sam tiene otra hipótesis que quiere probar. Esta vez su hipótesis nula es que todos sus productores de carne tienen instalaciones limpias. Por limpio, Sam significa que no hay ratones ni ratas corriendo y que todas las máquinas están limpias. Su hipótesis alternativa es que todos sus productores de carne no tienen instalaciones limpias. Su plan de análisis es registrar el nivel de limpieza de las instalaciones de sus productores de carne. Si la instalación del productor de carne cumple con el 90% de los criterios, entonces se marcará como limpia.

La región de aceptación de su lista final de datos es del 95% o más. Esto significa que le gustaría que el 95% o más de sus instalaciones se marcaran como limpias. ¿Por qué Sam eligió el 95% aquí en lugar del 99%? Sam, como investigador, puede elegir el número que quiera. Eligió el 95% aquí porque siente que está bien que la mayoría de sus instalaciones estén limpias. Eligió el 99% para el otro porque enviar la carne a tiempo es más importante para Sam.

Ahora que Sam tiene un plan de análisis, sale y revisa sus instalaciones. Encuentra que el 94% de sus instalaciones han sido marcadas como limpias. ¿Cómo puede Sam interpretar estos datos ahora? Dado que el 94% es menos del 95%, está fuera de la región de aceptación. Esto significa que la hipótesis nula de que todos sus productores de carne tienen instalaciones limpias no es válida. En cambio, la hipótesis alternativa de que todos sus productores de carne no tienen instalaciones limpias es válida. Esto no es lo que quería Sam. Estos resultados le dicen a Sam que necesita trabajar con aquellas instalaciones que no están limpias para que cumplan con los estándares.

Resumen de la lección

Repasemos lo que hemos aprendido. Una prueba de hipótesis es el procedimiento formal que utilizan los estadísticos para probar si una hipótesis puede aceptarse o no. Una hipótesis es una suposición sobre algo. Es un proceso de cuatro pasos.

Paso uno: escribe la hipótesis.

Debes escribir una hipótesis nula y una hipótesis alternativa. La hipótesis nula es la hipótesis basada en el azar. La hipótesis alternativa es la hipótesis que muestra un cambio de la hipótesis nula que es causado por algo.

Paso dos: cree un plan de análisis.

Paso tres: analiza los datos.

Puede elegir el método del valor P o el método de la región de aceptación. El valor P es la probabilidad de observar la estadística deseada. Si este valor P es menor que el nivel de significancia, entonces la hipótesis nula no es válida. El nivel de significancia es la probabilidad de cometer el error de decir que la hipótesis nula no es válida cuando en realidad es cierta. La región de aceptación es un rango de valores elegido que da como resultado que la hipótesis nula se declare válida.

Paso cuatro: interprete los resultados.

Términos clave

  • Prueba de hipótesis: los procedimientos formales que utilizan los estadísticos para probar si una hipótesis puede ser aceptada o no.
  • hipótesis: una suposición sobre algo
  • hipótesis nula: hipótesis basada en el azar
  • hipótesis alternativa: hipótesis que muestra un cambio de la hipótesis nula que es causado por algo
  • Valor p: la probabilidad de observar la estadística deseada
  • región de aceptación: un rango elegido de valores que da como resultado que la hipótesis nula se declare como válida

Resultado de aprendizaje

Después de revisar esta lección, debería poder:

  • Definir hipótesis
  • Aplicar el método de cuatro pasos para realizar una prueba de hipótesis adecuada
  • Determinar si una hipótesis puede aceptarse o no

Articulos relacionados