Importancia de la estadística: definición, niveles y regiones críticas

Publicado el 21 septiembre, 2020

Definición

Hace algunos años hubo un gran alboroto que acusó a las vacunas de causar autismo. (Las vacunas son una forma débil de infección que se administra a las personas para evitar que contraigan la infección completa. El autismo es un trastorno generalizado del desarrollo que se caracteriza por dificultades para socializar y comunicarse, y se cree que afecta a más de 1 de cada 100 personas). Esto es, por supuesto, ridículo, ya que se ha descubierto que la estructura cerebral de las personas con autismo es diferente a la de otras personas. Ningún simple disparo podría alterar así el cerebro de una persona. Sin embargo, algunas personas todavía no sabían esto y se asustaron.

Mi razón para mencionar esto es mostrarles cómo es necesario comprender las pruebas de significancia, junto con sus pruebas estadísticas. Estadísticamente significativo significa que la relación en los resultados no se produjo por azar. La mayoría de los investigadores trabajan con muestras , definidas como una sección de la población. Una población se define como la colección completa a estudiar. Dado que un investigador no está mirando a todo el mundo, existe la posibilidad de que recoja, por accidente, una muestra que le lleve a conclusiones erróneas. Para evitar esto, casi todas las pruebas estadísticas buscan significancia estadística.

Usando nuestro ejemplo de autismo y vacuna, después de que se realizaron varias pruebas, los investigadores encontraron que no había relación. Podían hacer esta afirmación con confianza porque sus resultados eran estadísticamente significativos a pesar de usar una muestra. Entonces, aunque no probaron a todas las personas que recibieron una vacuna, los investigadores no encontraron relación entre quienes recibieron la vacuna y quienes fueron diagnosticados con autismo.

Valor p

Cuando ejecute una prueba estadística, calculará un valor p , que se define como el valor del nivel de significancia. Este valor estará representado por un decimal, entre 1.0 y menos de .01. Este valor le informará qué tan probable es que la hipótesis nula , o la predicción de que no hay relación, sea cierta.

El nivel comúnmente aceptado del valor p para que la relación sea estadísticamente significativa es .05. Esto significa que 1 de cada 20 veces sus resultados serán positivos a pesar de que no existe una relación real. En nuestro ejemplo de autismo, habrá algunos estudios que encontrarán conexiones significativas entre el autismo y las vacunas. Esto significa que 1 de cada 20 veces los resultados serán positivos según la probabilidad pura y no porque exista una relación estadística.

¿De dónde viene este .05? ¿Cuál es el valor p ? Se deriva de observar la curva de campana y examinar la fuerza de la relación y la probabilidad de que no haya relación. Volviendo a nuestro ejemplo de autismo / vacuna: si tuviera que inventar algunos de los valores p , podrían ser .03, .001 y .5. Enumeré tres, y todos están inventados. Los dos primeros, .03 y .001, serían estadísticamente significativos. El .5 no sería estadísticamente significativo.

Regiones críticas

La importancia estadística proviene de la curva de campana. En una prueba estadística, busca ver si existe una relación entre los números. Esta relación puede ser en forma de puntuaciones similares, como una correlación, o diferentes, como una prueba t . Al probar la significancia, está probando sus datos para ver si su valor cae en la región crítica , definida como el valor estadístico que le permitirá rechazar la hipótesis nula.

Lo que esto significa es que cuando realiza una prueba estadística, terminará con un valor p . Si el número cae en el área de regiones críticas, entonces su relación es estadísticamente significativa y puede rechazar la hipótesis nula. Esto se debe a que en las regiones críticas, está probando para ver si la relación entre sus puntajes es lo suficientemente fuerte. Si la relación es débil, su puntuación caerá en el área de hipótesis nula y no será estadísticamente significativa.

Las regiones críticas constituyen el 5% superior, o .05, de las posibles respuestas. Si la relación es débil, es probable que los resultados que obtenga sean el resultado de un error de recopilación. Si la relación es fuerte, entonces puede decir con cierta confianza que incluso si hay un error de recopilación, los resultados todavía nos informan que existe una relación. ¿Por qué se eligió .05? Porque en 1 de cada 20 veces, los resultados serán incorrectos y le darán un tipo específico de error que se consideró aceptable. Ahora exploraremos estos errores.

Error

¿Qué pasa si terminas con un resultado que es estadísticamente significativo en papel, pero en realidad no lo es? Esto podría deberse a un error de muestreo o una casualidad en los números. ¿Qué pasa si no encuentra resultados, pero en realidad los hay?

Se dice que ocurre un error de tipo I cuando se rechaza incorrectamente una hipótesis nula. Si recuerda, una hipótesis nula establece que no hay relación. Entonces, si rechazó incorrectamente una hipótesis nula, efectivamente está diciendo: ‘Sí, hay una relación’, cuando en realidad no la hay. Un error de tipo I se considera mucho más dañino y peligroso que el otro tipo de error, en el que nos adentraremos. Esto se debe a que los científicos suelen tomar decisiones y trabajar bajo el supuesto de que todo está bien. Es como subir a un puente, pero el puente no está realmente ahí.

Se dice que un error de tipo II ocurre cuando un investigador no rechaza la hipótesis nula. Esto se traduce en que un investigador no encuentra una relación cuando realmente existe. Esto es como no querer caminar por el acantilado porque no crees que haya nada allí, cuando en realidad lo hay. Un error de tipo II no se considera tan grave como uno de tipo I porque los investigadores eventualmente podrían encontrarlo en sus pruebas.

Resumen de la lección

Estadísticamente significativo significa que la relación en los resultados no se produjo por azar. Dado que los investigadores trabajan con muestras , definidas como secciones de la población, y no con poblaciones , definidas como la colección completa que se va a estudiar, existe la posibilidad de un error de muestreo.

Para asegurarse de que esto no suceda, se calcula un valor p , definido como el valor del nivel de significancia, para garantizar que la hipótesis nula , o la predicción de que no existe relación, se rechace legítimamente. Normalmente se establece en .05. Este se basa en las regiones críticas , definidas como el valor estadístico que le permitirá rechazar la hipótesis nula.

Sin embargo, existe la posibilidad de que la hipótesis nula no se rechace correctamente. Se dice que ocurre un error de tipo I cuando se rechaza incorrectamente una hipótesis nula. Se dice que ocurre un error de tipo II cuando una hipótesis nula no se rechaza incorrectamente.

Resultado de aprendizaje

Después de ver esta lección, debería poder definir estadísticamente significativo y explicar cómo los investigadores evitan los errores de muestreo.

¡Puntúa este artículo!