Correlación: fórmula y tipos

Rodrigo Ricardo Publicado el 23 noviembre, 2020 5 minutos de lectura

Definición de correlación

En el lenguaje cotidiano normal, una correlación implica una relación entre dos o más cosas. Puede relacionar el olor de los crayones con su juventud o el sonido de las olas con las vacaciones. En matemáticas, la correlación es una medida de la dependencia de una variable de otra. Básicamente, se hace la pregunta: «Si aumento esta variable en una unidad, ¿qué tan bien puedo predecir lo que sucederá en la otra variable?» Buena pregunta, ¿verdad? Veamos cómo funciona esto.

Tipos de correlaciones

En términos generales, hay tres tipos diferentes de correlaciones: correlación positiva, negativa y neutra o sin correlación. Una correlación positiva perfecta significaría que si aumentara una variable en una unidad, podría predecir con un 100% de precisión cuánto aumentaría la otra variable. Una correlación negativa perfecta indicaría una predicción 100% precisa de la disminución en la otra variable. Si no hay correlación, o una correlación neutra entre dos variables, cambiar una variable no tendrá un resultado predecible en la otra variable.

Por supuesto, habrá relaciones que caen en el espectro entre estas tres descripciones generales. Ahí es donde entran en juego las fórmulas.

Fórmulas para correlaciones

La fórmula completa para la correlación es bastante larga; échale un vistazo:

Cálculo de correlación
correlación

No vamos a intentar leer todo fonéticamente. Pero, no hace falta decirlo, está intentando dar cuenta de muchas variables diferentes a la vez. Como puede ver, esta ecuación puede consumir bastante tiempo incluso para unos pocos puntos de datos. Es por eso que este cálculo casi siempre lo realizan computadoras. Aunque si realmente quisieras y supieras lo que estabas haciendo, ciertamente es posible que lo hagas a mano. Pero, si somos honestos, ¿por qué lo haría?

Entonces, cálculos, ¡verifique! Veamos cómo interpretar el número de correlación una vez que lo tenga.

Rango e interpretación de R

Así que ha hecho la parte difícil de calcular el coeficiente de correlación ( r ), ¿y ahora qué? La parte más importante es responder a la pregunta: «¿Qué significa este número?»

Cualquiera que sea el método que utilice para calcular el coeficiente de correlación, obtendrá un número entre -1,0 y +1,0. Un resultado de 1.0 indicaría una correlación positiva perfecta, 0 no da ninguna indicación de correlación y -1.0 es una correlación negativa perfecta. Cualquier valor entre cero y 1 indicaría una correlación positiva menos que perfecta y cualquier valor entre -1 y cero una correlación negativa menos que perfecta.

Digamos que calculó una correlación de 0,95 entre dos conjuntos de datos. ¿Significa esto que por cada unidad en la que aumente una variable, aumentará la otra en 0,95 unidades? Si bien esto puede ser una suposición común, resulta ser un error. Si toma 10 puntos en la línea y = 0.01 x y calcula la correlación, obtendrá 1.0. Lo mismo es cierto para los puntos en la recta y = 100 x . Una alta correlación entre los dos conjuntos no le da ninguna información sobre cuánto responderá una variable a los cambios en la otra.

Otra forma de pensar en esto es en términos de líneas de regresión. La línea de regresión le da una predicción de una variable cuando cambia la otra, pero la correlación le dice qué tan precisa es la predicción.

También es extremadamente importante tener en cuenta que la correlación y la causalidad no son lo mismo. Dos variables que tengan una correlación, incluso una correlación muy fuerte, no significa que una de ellas cause la otra.

Por ejemplo, si graficara los datos para el número de agentes de policía y la tasa de criminalidad en un área, probablemente obtendría una alta correlación. ¿Significa esto que los agentes de policía causan delitos? No, aunque podría argumentar de manera creíble que la alta criminalidad causa un aumento en los oficiales de policía.

¿Qué pasa si nota una alta correlación entre la venta de helados y los accidentes de bicicleta? ¿Existe una epidemia de ciclistas que intentan comer helado mientras conducen? ¿O todos los ciclistas que chocan piden helado para sentirse mejor después de un choque? La explicación más probable en este escenario es que las ventas de helados, los paseos en bicicleta y los choques de bicicletas están aumentando debido a algo más y madash; clima cálido y soleado durante los meses de verano, por ejemplo.

Resumen de la lección

Muy bien, tomemos un momento o dos para repasar lo que hemos aprendido. Como aprendimos, la correlación le da una indicación de la relación entre dos variables. La magnitud del número indica la precisión con la que un cambio en una variable predecirá el cambio correspondiente en la otra variable. Básicamente, las variables pueden tener efectos positivos, negativos o ningún efecto entre sí.

Una correlación positiva perfecta significaría que si aumentara una variable en una unidad, podría predecir con un 100% de precisión cuánto aumentaría la otra variable, mientras que una correlación negativa perfecta indicaría una predicción 100% exacta de la disminución de la otra. variable. Y si hay una correlación neutra , cambiar una variable no tendrá un resultado predecible en la otra variable.

Es importante tener en cuenta que la correlación no le dice cuánto aumentará o disminuirá una variable, sino qué tan preciso es el valor predictivo. Por último, debe tener mucho cuidado al equiparar alta correlación y causalidad. Son conceptos completamente diferentes. Una alta correlación cercana a 1.0 o -1.0 no da absolutamente ninguna información sobre si una variable causa o no a la otra.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador