Estadística inferencial para estudios de psicología

Publicado el 21 septiembre, 2020

Estadística inferencial

Imagine que una maestra está interesada en estudiar varios aspectos de su clase, como la personalidad de sus alumnos, si los niños son diferentes de las niñas o si los diferentes estilos de enseñanza conducen a resultados diferentes en sus alumnos. Para comprender cualquiera de estos aspectos de los niños de su clase, la maestra debe comprender algunas estadísticas básicas para poder cuantificar su comprensión, o, en otras palabras, ponerla en forma numérica.

En otra lección de Psicología de la educación, puede aprender sobre ideas como la media, la mediana y la moda para describir a las personas, o cómo funciona una curva de campana estándar. Esta lección se centra en un tipo de estadística ligeramente diferente, denominada estadística inferencial .

Las estadísticas inferenciales son formas de analizar datos que le permiten al investigador sacar conclusiones sobre si una hipótesis fue apoyada por los resultados. Puede recordar el término inferencial porque proviene de la palabra ‘inferencia’, que significa ‘sacar una conclusión a partir de pistas en el entorno’. ¿Cómo funciona la estadística inferencial?

Dos tipos de estadísticas inferenciales

Para facilitar las cosas, pensemos en un ejemplo de un aula. Imagine que una maestra sospecha que los niños de su clase son más extrovertidos, o más comunicativos, enérgicos y sociales, que las niñas de su clase. La conjetura del maestro sobre la diferencia entre niños y niñas es lo que llamamos hipótesis . En psicología, una hipótesis es una suposición fundamentada sobre una tendencia, diferencia de grupo o asociación que se cree que existe.

Su hipótesis es que los niños son más extrovertidos que las niñas. ¿Cómo probaría ella esta hipótesis? El maestro probablemente haría algo para medir la extroversión, como darles a los estudiantes una encuesta de personalidad para completar, o simplemente observarlos y hacer un seguimiento de los comportamientos extrovertidos. De cualquier manera, puede medir el nivel de extroversión en cada niño y cada niña. Luego, puede comparar las puntuaciones de los dos grupos.

El primer tipo de estadística inferencial que debemos discutir se llama prueba t . Se usa una prueba t para comparar las puntuaciones promedio entre dos grupos diferentes en un estudio para ver si los grupos son diferentes entre sí.

En nuestro ejemplo, el maestro usaría una prueba t para comparar el nivel promedio de extroversión en el grupo de niños versus el grupo de niñas. Las pruebas T son muy comunes en psicología porque pueden usarse para comparar dos grupos cualesquiera en un experimento. Si haces un experimento en el que les pides a algunas personas que coman alimentos saludables y a algunas personas que coman alimentos no saludables, como dulces, podrías probarlos en alguna variable, como si les duele el estómago. Una prueba t se usaría nuevamente aquí, porque está comparando los dos grupos diferentes. Puede usar las pruebas t para comparar dos grupos que ocurren naturalmente, como niños versus niñas, o puede comparar dos grupos que ha creado en un experimento.

Entonces, una prueba t compara dos grupos. Puede recordar el término prueba t simulando que la letra ‘t’ representa la palabra ‘dos’, es decir, los dos grupos que está comparando. Pero, ¿qué pasa si quieres comparar más de dos grupos? Imagínese que el maestro piensa que a medida que los niños crecen, se vuelven más extrovertidos. Ahora podría dar pruebas de personalidad a los niños de cada grado de la escuela, desde el jardín de infancia hasta el sexto grado. ¿Cómo podría comparar todos estos grupos diferentes, ahora que tenemos más de dos?

El segundo tipo básico de estadística inferencial se denomina análisis de varianza . Los investigadores suelen utilizar el apodo ANOVA para esta prueba. Un análisis de varianza es una prueba que compara los puntajes promedio entre tres o más grupos diferentes en un estudio para ver si los grupos son diferentes entre sí.

En otras palabras, un ANOVA es exactamente lo mismo que una prueba t, pero puede analizar varios grupos a la vez. La diferencia es simplemente cómo funciona la ecuación para analizar los grupos, sobre lo cual puede aprender más en una clase de estadística si está interesado. Por ahora, todo lo que necesita saber es que el ANOVA compara múltiples grupos, mientras que una prueba t solo puede comparar dos grupos.

Veamos un ejemplo más de cuándo puede usar cada prueba. Imagine que un maestro cree que diferentes estilos de enseñanza dan como resultado diferentes puntajes cuando los niños toman una prueba sobre el material. Podría intentar dar una conferencia para un grupo de estudiantes, en lugar de hojas de trabajo con un segundo grupo de estudiantes. Luego les da a todos la misma prueba y quiere comparar los resultados.

Si solo tuviera estos dos grupos, usaría una prueba t para comparar las puntuaciones. Sin embargo, ahora digamos que quería agregar un tercer estilo de enseñanza, que consistía en hacer que los estudiantes aprendieran el material por su cuenta y luego se lo enseñaran unos a otros. Si ahora quiere comparar los tres estilos de enseñanza entre sí, usaría un análisis de varianza o una prueba ANOVA.

Valores p

Ahora conoce dos tipos de estadísticas inferenciales, la prueba t y el ANOVA. Pero, ¿cómo saber si los datos apoyan su hipótesis? Volvamos al ejemplo de la hipótesis de que los niños son más extrovertidos que las niñas. Imagine que el maestro califica las encuestas y encuentra que en una escala de 0 a 100, el puntaje promedio de los niños es 51, mientras que el promedio de las niñas es 49. Aquí solo hay una diferencia de dos puntos. ¿Es eso suficiente para que él decida que los chicos son más extrovertidos? ¿Qué pasa si hay un niño particularmente enérgico en la clase y una niña particularmente tímida, y esos dos estudiantes son los principales responsables de la diferencia de medios? ¿Y si los puntajes estuvieran separados por 5 puntos? ¿Serían suficientes 10 puntos?

Los psicólogos han decidido que necesitamos una forma de decidir si las diferencias entre los grupos son lo suficientemente grandes como para llegar a una conclusión segura de que los dos grupos son realmente diferentes y que los resultados no se deben simplemente al azar o a los participantes que aportan puntuaciones extremas que afectan la promedios. Cómo hacemos esto? La respuesta es algo llamado valor p . Siempre que hacemos alguna prueba estadística en psicología, incluida una correlación, una prueba t o un ANOVA, el cálculo produce un segundo número, que es el valor p. El valor p le indica la probabilidad de que los resultados del estudio se hubieran producido simplemente por azar.

El número que obtenga con un valor p siempre estará en el rango de 0.00 (lo que significa un cero por ciento de probabilidad de que los resultados ocurrieran al azar) y 1.00, lo que indica un 100% de probabilidad de que los resultados fueran aleatorios. Para que podamos llegar a una conclusión sólida, queremos que ese número sea lo más bajo posible o lo más cercano a cero. Volvamos al ejemplo. Si un maestro encontró que el puntaje promedio de los niños era de 51 y el puntaje promedio de las niñas era de 49, esos números están muy cerca entre sí. Entonces, es posible que un niño o una niña al azar en la clase afectara los promedios y que si hubiera usado un grupo diferente de niños y niñas, los números hubieran sido diferentes. Debido a la gran cantidad de incertidumbre en estos resultados, nuestro valor p probablemente sería muy alto, como alrededor del 90%. Esto significa que nuestro valor p sería 0,90.

Sin embargo, si los puntajes fueran muy diferentes entre sí, podríamos tener más confianza. Si el puntaje promedio de los niños fue de alrededor de 85 y el puntaje promedio de las niñas fue de alrededor de 15, entonces podemos estar muy seguros de que la mayoría de los niños son más extrovertidos que la mayoría de las niñas. Entonces, la posibilidad de que estos puntajes ocurrieran por casualidad sería muy baja, tal vez alrededor del 4%. Eso significa que nuestro valor p sería 0.04.

¿Qué tan seguros debemos estar antes de poder decidir si una hipótesis está respaldada? Como regla general, la mayoría de los psicólogos han decidido que solo deberíamos aceptar un máximo de un 5% de probabilidad de que las puntuaciones ocurrieran al azar; en otras palabras, deberíamos estar 95% seguros de que las diferencias de grupo no se deben realmente al azar. Eso significa que queremos un valor p de entre 0% y 5% de probabilidad, que se vería como un número entre 0,00 y 0,05. Cualquier valor de p de 0.05 o menos significa que podemos estar muy seguros de que nuestros resultados son válidos y no simplemente debido a factores de azar en el estudio.

Resumen de la lección

La estadística inferencial es lo que utilizan los psicólogos para decidir si las hipótesis están respaldadas o no por los resultados de cualquier estudio. Las pruebas T comparan las puntuaciones en dos grupos diferentes, mientras que las pruebas de análisis de varianza , o ANOVA , comparan tres o más grupos diferentes.

Para asegurarnos de que nuestros resultados no ocurrieron debido a una probabilidad aleatoria, buscamos un valor p entre 0.00 y 0.05, lo que nos dice que hay menos de un 5% de probabilidad de que los resultados sean aleatorios. Estos conceptos pueden ayudar a cualquier persona a establecer correctamente un estudio de psicología básica.

Objetivos de la lección

Después de ver esta lección, debería poder:

  • Definir estadísticas inferenciales
  • Diferenciar entre una prueba t y un análisis de varianza (ANOVA)
  • Explica qué es un valor p y cómo se usa en estadística.
¡Puntúa este artículo!