Correlación: definición, análisis y ejemplos

Publicado el 15 septiembre, 2020 por Rodrigo Ricardo

Correlación

La correlación se utiliza para describir cómo se relacionan los conjuntos de datos entre sí. La correlación se puede ver cuando se grafican dos conjuntos de datos en un diagrama de dispersión , que es un gráfico con un eje X e Y y puntos que representan los puntos de datos.

Imagen 1

El diagrama de dispersión de la Imagen 1 relaciona dos conjuntos de datos: años de educación en el eje x e ingresos en el eje y. Los puntos representan un punto de datos que brinda dos datos: años de educación e ingresos por año. Por ejemplo, puede ver que el punto de datos más a la izquierda muestra que alguien con alrededor de 6.2 años de educación gana aproximadamente $ 3,000 por año.

Tipos de correlación

La correlación puede ser positiva, negativa o sin correlación. La correlación positiva significa que a medida que aumenta un conjunto de datos, el otro conjunto de datos también aumenta. Los datos de la Imagen 1 tienen una correlación positiva porque a medida que aumentan los años de educación, también aumentan los ingresos. Por lo general, los conjuntos de datos correlacionados positivamente se ven como una línea que va hacia arriba y hacia la derecha en un diagrama de dispersión.

La correlación negativa significa que a medida que aumenta un conjunto de datos, el otro disminuye. La imagen 2 muestra dos conjuntos de datos desconocidos con una correlación negativa. A medida que aumenta el conjunto de datos en el eje x, el conjunto de datos en el eje y disminuye. Normalmente, los conjuntos de datos correlacionados negativamente se ven como una línea que va hacia abajo y hacia la derecha en un diagrama de dispersión.

Imagen 2

Sin correlación significa que los dos conjuntos de datos no están relacionados en absoluto. En otras palabras, esto significa que un conjunto de datos no aumenta ni disminuye con el otro. Normalmente, no se ve ninguna correlación cuando los puntos de datos están muy dispersos, como en la Imagen 3.

Imagen 3

Positivo y negativo no es la única forma de describir la correlación; la correlación también se puede describir por su fuerza. Los conjuntos de datos también pueden tener una correlación perfecta, una correlación fuerte o una correlación débil. Cuanto más cerca estén los puntos de datos y más formen una línea recta, más fuerte será la correlación. Si los puntos de datos forman una línea recta perfecta, se dice que los conjuntos de datos tienen una correlación positiva o negativa perfecta según la dirección de la línea (arriba y derecha = positivo, abajo y derecha = negativo).

La imagen 4 muestra tres gráficos con diferentes niveles de correlación. El primer gráfico tiene una fuerte relación positiva, mientras que el segundo tiene una correlación positiva baja o débil. El tercer gráfico no tiene relación o no tiene correlación.

Ejemplos fuertes, débiles y sin correlación

Coeficiente de correlación

La correlación se puede calcular como un número llamado coeficiente de correlación (r) . El coeficiente de correlación puede ayudar a identificar qué tipo de relación tienen los conjuntos de datos y qué tan fuerte o débil es esa relación. El coeficiente de correlación se sitúa entre -1,0 y 1,0.

Gráfico de coeficiente de correlación

Ejemplo

Veamos un ejemplo completo. Supongamos que quiere ver si la cantidad de pizza que comen sus amigos está relacionada con la cantidad de refresco que beben para saber cuántos refrescos comprar en su próxima fiesta. La imagen 7 muestra algunos datos que recopiló sobre sus amigos y un diagrama de dispersión de esos datos. La gráfica de dispersión muestra que los datos tienen una relación positiva, como lo indica el hecho de que los datos casi forman una línea recta que va hacia arriba y hacia la derecha.

Dado que los datos están bastante cerca de esta línea imaginaria, podemos decir que la relación es fuerte. Esto significa que la cantidad de rebanadas de pizza que comen sus amigos tiene una fuerte correlación positiva con la cantidad de refresco que sus amigos beberán. A medida que aumenta el número de porciones de pizza que se comen, también aumenta la cantidad de refresco consumido. Esto está respaldado por el hecho de que el coeficiente de correlación (r) es .84. Si mira hacia atrás en la Imagen 5, puede ver que este número también hace referencia a una fuerte correlación positiva.

Ejemplo de datos de correlación de pizza

Resumen de la lección

La correlación describe la relación entre dos conjuntos de datos. Esta relación puede ser positiva perfecta, positiva fuerte, positiva débil, sin correlación, negativa débil, negativa fuerte o negativa perfecta. Los diagramas de dispersión son una buena representación visual de conjuntos de datos que pueden indicar qué tipo de correlación está presente. Un coeficiente de correlación (r) entre -1 y 1 dará una mejor idea de qué tipo de correlación está presente.

Articulos relacionados