Uso del método de puntuación bruta para calcular el coeficiente de correlación

Correlación

Tu cerebro es asombroso. Aprendes a asociar cosas. Como el olor a chocolate en la casa suele significar que hay tarta de chocolate. ¿Por qué sabes esto? No has visto el pastel de chocolate. Sin embargo, lo hueles.

Este es un ejemplo de cómo su cerebro correlaciona el olor a chocolate con la presencia de pastel de chocolate. Una correlación se define simplemente como una relación entre dos variables. Hay muchas formas en que una persona puede calcular una correlación, por lo que nos centraremos en la más popular.

Una correlación de Pearson es un procedimiento estadístico para determinar la correlación de datos de intervalo o razón distribuidos normalmente. ¿Qué diablos significa eso? El procedimiento estadístico simplemente significa una fórmula estadística con la que trabajará. Llegaremos a eso en un momento. Normalmente distribuido es una forma de describir la extensión de los datos. Necesitamos una foto para esto.


Datos normalmente distribuidos en una curva de campana
ejemplo de curva de campana

¡Auge! Está la curva en forma de campana. A lo largo del eje Y (el alto), vemos con qué frecuencia ocurre algo. Cuanto más a menudo ocurre, más alta es la línea. En el eje X tenemos las respuestas que son posibles. Entonces, en un conjunto de datos distribuidos normalmente, la mayoría de nuestras respuestas estarán en el medio, lo que le da la altura, y pocas respuestas estarán en el extremo alto o bajo, lo que hace que esos puntos sean más cortos.

El intervalo y la razón describen la medición cuantitativa de datos. Esto se explora con más detalle en otras lecciones. Todo lo que necesita saber es que necesita preguntas bien escritas para usar una correlación, preguntas que le brinden una variedad de posibles respuestas.

Hay formas de evitar algunas de las preocupaciones de intervalos y proporciones. Si tiene una gran cantidad de participantes, aún puede ejecutar su correlación porque el gran tamaño de la muestra lo compensará. Por ejemplo, si tiene un montón de preguntas como, “Califique esta lección, 1 es mala y 5 es excelente”, entonces necesitará más de 100 participantes. Ahora, pasaremos al cálculo real de una correlación de Pearson utilizando datos sin procesar.

Recomendado:  Método de Newton-Raphson para sistemas de ecuaciones no lineales

Cálculo

Digamos que estamos tratando de correlacionar algo como “número de horas sentado cada día” y “peso en libras”. Como nos ocuparemos con una fórmula, he designado las horas como X y el peso como Y . Esto ayudará a facilitar nuestro cálculo más adelante.

Enumero el número de cada sujeto, de modo que el sujeto uno esté en el primer espacio y el sujeto dos en el segundo espacio.


Datos, por ejemplo, problema
tabla de datos de ejemplo

El orden de las asignaturas no importa, pero debes mantener juntos los resultados de cada asignatura. Es decir, mi primer espacio de 4 horas y 160 libras. necesita permanecer vinculado, de lo contrario nuestras matemáticas son inútiles. ¿Importa cuál es X y cuál es Y ? No. Puede cambiar las horas a Y y el peso a X , y obtendrá los mismos resultados.

A continuación, veremos tres columnas a continuación: XY , X ^ 2 e Y ^ 2. Si no lo había adivinado, haremos algunos cálculos. En la columna XY , multiplicará el etiquetado X por la columna Y. En la siguiente columna, se enfrentarán cada X . Entonces, 4 se eleva al cuadrado a 16. Lo mismo se hace con la columna Y al cuadrado, 160 al cuadrado son 25,600. ¿Ves lo que hice ahí?


Tabla después de realizar cálculos
ejemplo de tabla de datos

A continuación, veremos la fórmula a continuación y, a menos que esté familiarizado con las estadísticas, será aterrador.


Fórmula de correlación de Pearson
fórmula escrita a mano

El símbolo de abajo, sigma, es realmente aterrador cuando está frente a un montón de otras cosas. Pero realmente no tiene por qué ser así. Todo sigma significa es “sumar”. Aprendiste a sumar hace mucho tiempo. Entonces, cuando es sigma X , eso significa que sumas toda la columna X. Cuando dice sigma X ^ 2, suma la columna de X ^ 2 que hicimos.

Recomendado:  Método PQ4R: leer, reflexionar, recitar y revisar los pasos

Símbolo de sigma, que significa sumar
símbolo sigma

Para complicar un poco más, ¿ves la (sigma X ) ^ 2 y la (sigma X ^ 2) en la fórmula anterior? Cuando la X está sola entre paréntesis, eso significa que está usando la suma de la columna X. Entonces, lo cuadras. Si el signo del cuadrado está dentro del paréntesis, entonces estás usando la suma X ^ 2.

La letra minúscula n significa el número de participantes en el experimento. Tenemos cinco personas. Con nuestra fórmula en mente, vamos a sumar todas las columnas y conectarlas en sus espacios apropiados. Aquí están las columnas sumadas:


Tabla de datos con sumas
tabla de datos con sumas

Allí, todo está enchufado en su lugar adecuado. Después de esto, es solo un orden masivo de operaciones. Multiplica las partes superiores juntas. Multiplica, suma y resta las partes inferiores, y por el amor de Dios, ¡no olvides enraizar la raíz cuadrada en la parte inferior! Estaba haciendo estas matemáticas a medida que avanzaba y me olvidé de cuadrarlo, y todo sesgó.

Al final de esto, obtendrá .4436. Este es su coeficiente de correlación e indica que hay una correlación débil. Para obtener más información sobre esto, busque la lección que explica los coeficientes de correlación.

Resumen de la lección

Una correlación se define como una relación entre dos variables. Una forma de convertir sus puntajes brutos en un coeficiente de correlación es una correlación de Pearson , definida como un procedimiento estadístico para determinar la correlación de datos normalmente distribuidos, de intervalo o de razón. El procedimiento estadístico simplemente significa una fórmula estadística. Normalmente distribuido es una forma de describir la extensión de los datos. Los pasos son, aproximadamente:

  • Coloque todas sus puntuaciones en dos columnas.
  • Cree una columna XY , X ^ 2 e Y ^ 2.
  • Complete las columnas con el número apropiado.
  • Resume las columnas.
  • Inserte las sumas adecuadas en la fórmula.
  • Realice el orden de operaciones.
Recomendado:  Uso y abuso de suplementos dietéticos

Los resultados del aprendizaje

Tendrá la capacidad de hacer lo siguiente después de ver esta lección en video:

  • Definir correlación de Pearson, procedimiento estadístico y distribución normal.
  • Identificar la fórmula de correlación de Pearson
  • Describir los pasos para encontrar el coeficiente de correlación de un conjunto de datos usando la fórmula de Pearson.