El coeficiente de correlación: definición, fórmula y ejemplo

Publicado el 3 noviembre, 2020 por Rodrigo Ricardo

Decodificación del coeficiente de correlación

Rachel está realizando una investigación para su clase de psicología. Ella está observando los patrones de asistencia de los estudiantes en las clases de educación general de primer año. Ha registrado el número de ausencias entre cinco estudiantes, el número de clases que están tomando, el promedio de ausencias por clase, el total de ausencias en todas las clases y el número promedio de tareas asignadas en cada clase. Su profesor quiere que encuentre una correlación entre estas variables usando el coeficiente de correlación. Rachel echa un vistazo a la ecuación:

Pearson R

¡Vaya, esta es una ecuación intimidante! Rachael no tiene idea de por dónde quiere empezar con este problema. ¡No se preocupe! En esta lección, aprenderá sobre el coeficiente de correlación y cómo usarlo para encontrar correlaciones en la investigación de Rachael.

Definición del coeficiente de correlación

Probablemente sepa que una correlación es la relación entre dos conjuntos de variables que se utilizan para describir o predecir información. Por tanto, el coeficiente de correlación es el grado en que se relaciona el cambio en un conjunto de variables. Esto significa que estamos tratando de averiguar si las dos variables tienen una correlación, qué tan fuerte es la correlación y si la correlación es positiva o negativa. ¡Consulte nuestras otras lecciones para obtener más información sobre las correlaciones positivas y negativas!

Para encontrar la correlación exacta entre variables, deberá utilizar la ecuación del coeficiente de correlación. Cuando se resuelva, la ecuación del coeficiente de correlación le dará un número entre -1 y 1. Cuanto más cerca esté el número de uno positivo, más fuerte será la correlación positiva. Cuanto más cercano esté el número al negativo, más fuerte será la correlación negativa. Y cuanto más cerca de cero esté el número, más débil será la correlación. Cero significa que no hay correlación entre las variables. Analicemos esta ecuación para que sea más fácil de entender.

Usando coeficiente de correlación, numerador

Arriba está la ecuación del coeficiente de correlación, también conocida como r de Pearson. Analicemos cada parte de la ecuación para hacerla más manejable. Recuerde, los datos Rachael ha recogido es en forma de dos variables: x y y . Será importante recordar esto ya que usamos la ecuación del coeficiente de correlación.

Por ahora, centrémonos en la parte superior de esta ecuación. Lo primero que ve en esta ecuación es n , que significa el número de pares ordenados. Veamos los datos que recopiló Rachel:

numerador

Recuerde que Rachel recopiló datos sobre cinco personas. En esta tabla, observe que hay cinco pares ordenados. Por lo tanto, la n para este conjunto de datos es 5.

En segundo lugar, el símbolo E que ve en esta ecuación significa suma. Esto significa que deberá sumar todos los números que siguen a la suma. Veamos la siguiente parte de la ecuación antes de entrar más en la suma. La tercera parte de esta ecuación es xy . Esto significa que deberá multiplicar cada valor de x y cada valor de y juntos en el conjunto de datos. Echemos un vistazo a nuestros datos para comprender mejor este concepto:

numerador 2

Agregué una columna a la tabla de Rachel y la etiqueté xy . Ahora puedo multiplicar cada valor de x con cada valor de y en cada fila para crear un nuevo valor para esta columna. Para la fila uno, obtengo el valor 8, porque la x es 4 y la y es 2 para ese par ordenado. Ahora, observe que agregué una fila debajo de los valores en la parte inferior de la tabla con el símbolo de suma. Necesitamos sumar todos los valores en cada columna para obtener la suma de cada valor. Para la primera columna, la suma de x , agregué 4 + 4 + 6 + 5 + 4 = 23. Hice el mismo proceso para las otras columnas en esta tabla.

Bien, volvamos a nuestra ecuación. Ahora, los elementos cuarto y quinto de esta ecuación deberían tener un poco más de sentido. El cuarto elemento aquí es la suma de los valores de x , que es el valor en el que estábamos trabajando en el conjunto de datos de Rachel. El quinto elemento es la suma de los valores de y , que sería 9, el valor de la segunda columna de nuestra tabla. Ahora echemos un vistazo a cómo se verían los valores en nuestra ecuación.

numerador con números insertados

Puede ver cada uno de los elementos de la ecuación, reemplazados con los valores correspondientes de nuestra tabla. El numerador, o la parte superior, de nuestra ecuación se lee así: 5 (44) – (23) (9). ¡Bueno! ¡Creo que esto es factible! Usando el orden de las operaciones, podemos resolver esta ecuación y determinar que el número superior en el coeficiente de correlación es 13.

¡Ahora, echemos un vistazo a la parte inferior de esta ecuación!

Usando coeficiente de correlación, denominador

Cuando nos enfocamos en la parte inferior de la ecuación, probablemente comenzará a ver algunos elementos similares en esta parte de la ecuación como lo hicimos en la parte superior. Primero, la n , una vez más, representa el número de pares ordenados, que en el caso de Rachel es 5.

En segundo lugar, el siguiente elemento de esta ecuación es la suma de los valores x ^ 2. Entonces, eche un vistazo a nuestra tabla:

tabla denominador

Observe que agregué una cuarta y una quinta columna a la tabla de Rachel. Esta vez, tenemos x ^ 2 e y ^ 2. Para obtener los valores de x al cuadrado, necesitará tomar el valor de x y elevarlo al cuadrado en la misma fila. Por ejemplo, el primer valor de x en la primera fila, la primera columna es 4, por lo que nuestro valor x ^ 2 sería 16. Tendríamos el mismo valor para la fila 2. Fila 3, la primera columna es 6, entonces nuestro x- cuadrado el valor sería 36 y así sucesivamente.

Hará lo mismo con los valores y ^ 2. La primera fila, el valor de la segunda columna para y es 2, por lo tanto, el valor de y ^ 2 sería 4. Observe que en la última fila, he calculado la suma de los valores x cuadrados sumando 16 + 16 + 36 + 25 + 16 = 109. El valor de suma para el cuadrado de y es 4 + 1 + 9 + 4 + 1 = 19.

Los siguientes elementos de la r de Pearson requieren que tenga un conocimiento sólido del orden de las operaciones. El tercer elemento es la suma de los valores de x , al cuadrado. Lo cual, como verá en un momento, es diferente a la suma de los valores x ^ 2. ¡El paréntesis entre la xy los dos marcan una gran diferencia!

El cuarto elemento es el número de pares ordenados y el quinto elemento es la suma de los valores y ^ 2. Por último, el sexto elemento es la suma de los valores de y al cuadrado. Usemos los valores que hemos encontrado en nuestra tabla y aplíquelos a esta ecuación.

Inserté los valores de nuestra tabla en esta parte de la ecuación. Ahora, tenemos una ecuación que dice: la raíz cuadrada de ((5 * 109) – (23 ^ 2)) ((5 * 19) – (9 ^ 2)).

¡Repasemos este paso a paso para resolverlo! Lo primero que voy a hacer en esta ecuación es multiplicar 5 y 109, lo que me da 545. Luego, el cuadrado 23, lo que me da 529. Luego, multiplicar 5 y 19, lo que me da 95. Luego, encontrar el cuadrado de 9 , que es 81. Luego, reste 529 de 545, que es 16. Ahora, reste 81 de 95, que es 14. Finalmente, multiplique 16 y 14, que es 224, y saque la raíz cuadrada. Nuestro número para el denominador de esta ecuación es aproximadamente 14,97.

Ahora, podemos resolver el último de esta ecuación tomando el primer número, 13, y dividiéndolo por nuestro segundo número, 14.97. 13 / 14.97 es aproximadamente .88. Esto nos dice que, según la información que recopiló Rachael, existe una fuerte correlación positiva entre la cantidad de clases que toma un estudiante y la cantidad promedio de ausencias por clase.

Resumen de la lección

La ecuación del coeficiente de correlación puede ser una ecuación intimidante hasta que la descomponga. Una correlación es la relación entre dos conjuntos de variables que se utilizan para describir o predecir información, y el coeficiente de correlación es el grado en que se relaciona el cambio en un conjunto de variables.

Recuerde, cuando se resuelva, la ecuación del coeficiente de correlación le dará un número entre -1 y 1. Cuanto más cerca esté el número de uno positivo, más fuerte será la correlación positiva. Cuanto más cercano esté el número al negativo, más fuerte será la correlación negativa. Y cuanto más cerca de cero esté el número, más débil será la correlación. Cero significa que no hay correlación entre las variables.

Antes de intentar resolver esta ecuación nuevamente, primero cree una tabla con todos los valores que necesita, incluidos x , y , x * y , x ^ 2, y ^ 2 y las sumas de cada uno. Luego, trabaje la parte superior e inferior de las ecuaciones por separado para que pueda mantenerse organizado y no sentirse abrumado. Recuerde, la n representa el número de pares ordenados y la E pide la suma de los valores. Manténgase organizado con el orden de las operaciones: hay una diferencia entre los valores al cuadrado de x y la suma de x ^ 2. Ahora, ¡practique lo que sabe sobre esta ecuación con un breve cuestionario!

Los resultados del aprendizaje

Aproveche la oportunidad para realizar estas tareas tan pronto como concluya la lección:

  • Definir correlación y coeficiente de correlación.
  • Interpretar la ecuación del coeficiente de correlación
  • Trabajar las partes superior e inferior (numerador y denominador) de la ecuación del coeficiente de correlación
  • Reconocer la importancia del orden de las operaciones.

Articulos relacionados