Cómo interpretar las correlaciones en los resultados de una investigación

Publicado el 22 septiembre, 2020 por Rodrigo Ricardo

Introducción a la correlación

Imagina que estás leyendo el periódico y ves un artículo que dice que se realizó un estudio sobre si leer libros sobre vampiros hace que los niños quieran convertirse en vampiros. El artículo dice que existe una correlación entre leer libros de vampiros y el deseo de ser vampiro, y que la correlación es -1,5. El reportero concluye que los libros de vampiros deberían prohibirse, ¡porque están provocando que los niños se conviertan en vampiros! ¿Qué opinas de la conclusión de este reportero? Si comprende la teoría y las estadísticas detrás de los estudios correlacionales , sabrá que este reportero necesita volver a la escuela para aprender cómo funcionan realmente las correlaciones. Ese es el tema de esta lección.

El propósito de las correlaciones

Una correlación es una estadística simple que explica si existe una relación o asociación entre dos variables. Las correlaciones son probablemente la estadística más utilizada en el campo de la psicología, por lo que es importante comprender cómo funcionan.

Comencemos con cómo podríamos hacer un estudio correlacional básico antes de llegar al significado de los números reales de las estadísticas. En un estudio correlacional, los investigadores eligen dos variables que creen que podrían estar asociadas entre sí. Para esta lección, pensemos en un estudiante que quiere pasar de la escuela secundaria a la universidad. La oficina de admisiones de cada universidad querrá saber cómo fueron las calificaciones de la escuela secundaria de ese estudiante, porque creen que las calificaciones de la escuela secundaria pueden predecir las calificaciones de la universidad. En otras palabras, creen que las calificaciones de la escuela secundaria están asociadas con las calificaciones universitarias. ¿Por qué llegarían a esta conclusión? Podrían hacer un gráfico que muestre todos los estudiantes que han aceptado en el pasado, y este gráfico podría mostrar ambas variables.

En el eje y , podríamos graficar el promedio de calificaciones de la escuela secundaria de cada estudiante. En el eje x podríamos graficar el promedio general de calificaciones universitarias de ese mismo estudiante. Ponemos un punto en el gráfico que muestra dónde se cruzan estas dos variables. Seguimos hasta que tengamos un punto para cada alumno. Cada punto representa a una persona. Este tipo de gráfico se llama diagrama de dispersión . Un diagrama de dispersión muestra un punto para cada persona de interés, donde cada punto representa las puntuaciones de una persona en las dos variables de interés. Aquí, cada punto muestra las calificaciones de la escuela secundaria y la universidad de una persona. Puede recordar el nombre ‘gráfico de dispersión’ porque después de que trazamos o marcamos el gráfico con cada persona, parece que se han esparcido un montón de puntos por todas partes.

Una vez que se han trazado todos los puntos, podemos buscar el patrón general, o tendencia, que es una representación de la mayoría de las personas. En otras palabras, si dibujara una sola línea recta en este gráfico, ¿dónde trazaría la línea? Probablemente estaría aquí mismo. Esta línea es un resumen rápido del patrón general de puntos que vemos en el diagrama de dispersión.


Ejemplo de diagrama de dispersión
Gráfico de diagrama de dispersión

Ahora bien, ¿cómo se relaciona este gráfico con las correlaciones? Una correlación es simplemente un número que se asigna para representar este diagrama de dispersión y esta línea. La ecuación de cómo calcular el número con el que se termina es complicada y no es necesario que la sepa hasta que tome una clase de estadística en la universidad. Por ahora, todo lo que necesita saber es que la ecuación le da un número que es como un código, y puede interpretar este número, o código, para saber cómo se ve la gráfica que resultó en este número. Cómo leer el número es lo que cubriremos a continuación en esta lección.

Interpretación de la estadística: dirección

La estadística resultante que obtiene de una ecuación de correlación se llama coeficiente de correlación . Siempre habrá dos partes en un coeficiente de correlación. La primera parte es el signo o dirección, lo que significa si el coeficiente es un número positivo o negativo. Ese signo es la primera parte del código que debe conocer.

La segunda parte del coeficiente de correlación será un número. El número siempre estará entre cero y uno. Eso significa que el coeficiente de correlación siempre estará entre uno negativo y uno positivo, pero podría estar en cualquier punto intermedio. Repasemos cada parte del coeficiente de correlación y analicemos qué significa esa parte.

Empezaremos por el letrero o la dirección. A menos que su coeficiente sea exactamente cero, tendrá un número positivo o negativo. El signo de positivo o negativo es simplemente un código que indica cómo apareció la línea en el diagrama de dispersión. ¿Recuerda nuestro ejemplo anterior? Trazamos las calificaciones de la escuela secundaria y las calificaciones de la universidad, y terminamos con una línea que se veía así. Observe que la línea va desde la esquina inferior izquierda del gráfico hasta la esquina superior derecha del gráfico. Eso significa que cuando una de nuestras variables subió de valor, también lo hizo la otra variable. En otras palabras, si un estudiante tuvo un GPA alto en la escuela secundaria, es probable que también tenga un GPA alto en la universidad. A medida que una variable aumenta, la otra también aumenta.

Siempre que graficamos dos variables que se mueven en la misma dirección, la línea que dibujamos generalmente irá de la parte inferior izquierda a la parte superior derecha del gráfico. A esto lo llamamos una correlación positiva . Una correlación positiva significa que ambas variables se mueven en la misma dirección: a medida que una sube, la otra sube, o viceversa. A esto lo llamamos una correlación positiva porque cuando hacemos la ecuación para obtener nuestro coeficiente de correlación, el resultado será un número positivo . Puede ser desde +0.01 hasta +1.00.


Una correlación positiva significa que ambas variables se mueven en la misma dirección.
Dirección del gráfico de correlación positiva

La única otra opción para una correlación será que tenga un signo negativo delante del coeficiente. No le sorprenderá saber que llamamos a esto una correlación negativa. Una correlación negativa significa que las dos variables se mueven en la dirección opuesta entre sí: a medida que una sube, la otra baja. ¿Cómo se vería eso en un diagrama de dispersión? ¿Dónde trazaríamos la línea?

Imagina que graficamos dos variables que creemos que se mueven en direcciones opuestas. Escojamos el promedio de calificaciones de la universidad y la cantidad de horas que un estudiante pasa de fiesta en lugar de estudiar. Podríamos imaginar que cuanto más festejas en la universidad, más bajas serán tus calificaciones. Entonces las dos variables se mueven en direcciones opuestas; a medida que uno sube (eso sería la fiesta), el otro baja (ese sería el GPA).

Si realizamos un gráfico de dispersión de varios estudiantes que ya estaban en la universidad, que podría poner número de horas de fiesta en el y eje x, y tener grados universitarios en la x eje x. Ahora, el diagrama de dispersión podría verse así. ¿Dónde trazaríamos la línea que representa el patrón general? Aquí, va de la parte superior izquierda a la inferior derecha. Aquí siempre será donde va la línea para una correlación negativa.

Entonces, ahora sabe lo que significa el signo positivo o negativo en un coeficiente de correlación. Le dice si las dos variables se mueven en la misma dirección o en direcciones opuestas. También le indica la dirección general de la línea que vería en un diagrama de dispersión que muestra todas las personas utilizadas para calcular la correlación.

Interpretación de la estadística: el número

La segunda parte de cualquier coeficiente de correlación es el número que aparece después del signo. Recuerde que un coeficiente de correlación siempre variará de cero a uno. Por lo tanto, es posible que vea una correlación de -0,85, +0,14 o +0,98. Ya sabes lo que significa el signo negativo o positivo. ¿Qué significa el número detrás de él?

El número que ve en una correlación le dice la fuerza de la asociación entre las dos variables de interés. En otras palabras, ¿estas dos variables están muy relacionadas o no? Repasemos algunos ejemplos para aclarar esto.

Si el número que obtiene es un cero perfecto, eso significa que las dos variables no están relacionadas entre sí en absoluto. Puede imaginar algunas variables que simplemente no tienen nada que ver entre sí. Por ejemplo, las calificaciones universitarias no están correlacionadas con su estatura, el color de sus ojos o el número promedio de porciones de pizza que come en una semana determinada. Estas variables no están correlacionadas, lo que significa que el coeficiente de correlación que obtendría sería cero.

A medida que una correlación se mueve de cero a uno, significa que la relación se vuelve cada vez más fuerte. Una correlación baja significa que las dos variables están un poco relacionadas entre sí, pero no mucho. Una correlación alta, es decir, una que está más cerca del valor de uno, significa que las dos variables están muy relacionadas entre sí. Por ejemplo, las calificaciones de la escuela secundaria y las calificaciones universitarias generalmente están relacionadas entre sí.

Entonces, ¿cómo se ve esto en el diagrama de dispersión? Volvamos a una correlación de cero. Si intentáramos trazar dos variables que no tienen nada que ver entre sí, ¡terminaríamos con puntos en todo el gráfico! Básicamente, se vería como un montón de puntos aleatorios sin ningún patrón general. Aquí hay un ejemplo de cómo se vería. Si le pidiera que dibujara una línea en este gráfico que muestre el patrón, ¿qué haría? Realmente no podrías. Eso es lo que significa una correlación cero; no hay patrón en los puntos.

A medida que nos acercamos más y más al valor de uno (ya sea positivo o negativo), lo que sucede es que los puntos comienzan a agruparse uno alrededor del otro en un patrón reconocible. Comienzan a parecerse cada vez más a la línea que queremos trazar. Aquí hay un ejemplo de lo que es una correlación de +0,56. Puede ver que estamos empezando a ver un patrón. Aquí hay un ejemplo de cómo se ve una correlación de +0,91. Nos estamos acercando a ese alto valor de uno, por lo que puede ver que la línea es bastante obvia aquí. Si tuviéramos una correlación perfecta de +1,00, ¡se vería así! Puede ver que cada punto se encuentra perfectamente en la línea.

Recuerde que las correlaciones pueden ser negativas o positivas. Viste la gráfica de +0.56 antes. Un gráfico de -0,56 se vería exactamente igual, excepto que la inclinación de los puntos iría en la otra dirección, como puede ver aquí. Y aquí hay un ejemplo de cómo se vería -0,91, y aquí hay un ejemplo de -1,00. Es importante recordar que una correlación de -1,00 y una correlación de +1,00 indican una asociación perfecta entre las dos variables. Ambas correlaciones indican la misma fuerza en términos de cómo una variable se relaciona con la otra. La única diferencia está en la dirección de la línea.

Ahora que comprende tanto la dirección (positiva o negativa) como el número (de cero a uno), siempre que vea una correlación de un estudio, sabrá lo que significa. Ese pequeño coeficiente le dice a ambos si las dos variables se mueven juntas o en direcciones opuestas, y le dice cuán fuertemente están relacionadas las dos variables entre sí.

Precauciones con correlaciones


Aunque algunas variables pueden estar correlacionadas, también pueden verse influenciadas por otras variables.
Imagen del tercer problema variable

Solo queda una cosa por saber sobre las correlaciones. El mayor error que cometen las personas cuando ven una correlación entre dos variables es pensar que una de las variables causó la otra. Eso no es necesariamente cierto, incluso si la correlación es perfecta -1,00 o perfecta +1,00. Por qué no?

Volvamos a nuestro ejemplo de calificaciones. Sabemos que las calificaciones de la escuela secundaria y las calificaciones universitarias están, de hecho, correlacionadas positivamente entre sí en un grado bastante alto. Pero, ¿eso significa que tus calificaciones en la escuela secundaria en realidad te llevaron a obtener calificaciones similares en la universidad? No. En cambio, hay otras variables que realmente hacen que ambas variables se muevan en la misma dirección. Puede ser que seas muy inteligente y que tu inteligencia haga que ambos tipos de calificaciones sean altas. O podría ser que eres un estudiante muy dedicado y que tu motivación para estudiar en realidad hizo que ambos tipos de calificaciones fueran altas. Este tipo de situación se denomina problema de tercera variable.. Aunque nuestras dos variables originales de las calificaciones de la escuela secundaria y las calificaciones de la universidad están correlacionadas, en realidad ambas son causadas por alguna otra tercera variable o incluso una cuarta o quinta variable. Entonces, en realidad, no podemos decir que las calificaciones universitarias sean causadas por las calificaciones de la escuela secundaria.

Si bien este concepto puede parecer simple con el ejemplo de las calificaciones, muchas personas cometen este error en los estudios de investigación sobre los que puede escuchar en la televisión o en los periódicos. Digamos que un investigador descubre que existe una correlación positiva entre la cantidad de veces que los padres alientan a sus hijos y qué tan bien les va a esos niños en la escuela. Es muy tentador para nosotros concluir que alentar a los niños hace que les vaya bien en la escuela, debido a la correlación. Pero llegar a esa conclusión sería un error. En realidad, no sabemos si alentar a los niños hace que les vaya bien. Podría ser que cuando a los niños les va bien en la escuela, sus padres estén más motivados para animarlos, ¡así que la causa realmente va en la otra dirección! O, podría ser que las personas que viven en vecindarios elegantes sean más propensas a alentar a sus hijos (a verse bien con los vecinos) y es más probable que tengan hijos a los que les vaya bien en la escuela (a verse bien a los otros estudiantes). Entonces, aquí, una tercera variable, los vecindarios, es en realidad el factor causal.

Lo importante que hay que recordar es que, si bien es posible que dos variables correlacionadas tengan una relación causal, no podemos estar seguros. Para estudiar las relaciones de causa y efecto , tendríamos que hacer un verdadero estudio experimental . Puede aprender sobre experimentos reales en una lección diferente.

Resumen de la lección

Un tipo común de estadística en psicología se llama correlación. Las correlaciones le dicen si dos variables están relacionadas entre sí y, de ser así, de qué manera.

El signo de una correlación le dice en qué dirección se mueven las variables. Una correlación positiva significa que las dos variables se mueven en la misma dirección. Una correlación negativa significa que se mueven en direcciones opuestas. El número en una correlación siempre estará entre cero y uno. Cuanto más cercano esté el número a uno (positivo o negativo), más fuerte será la asociación entre las dos variables.

Recuerde que el hecho de que dos variables estén correlacionadas no significa necesariamente que una cause la otra.

Si puede recordar toda esta información sobre las correlaciones, está bien preparado para comprenderlas e interpretarlas cuando lea sobre investigaciones o cuando haga las suyas propias.

Objetivos de la lección

Después de ver esta lección, debería poder:

  • Defina la correlación y el diagrama de dispersión, y comprenda cómo se utilizan los diagramas de dispersión para mostrar la correlación.
  • Explicar cómo interpretar el signo y el número de un coeficiente de correlación.
  • Comparar y contrastar correlaciones positivas y negativas
  • Describir problemas de tercera variable y diferenciar entre correlación y causalidad.

Articulos relacionados