Crear una matriz de correlación en Excel

Rodrigo Ricardo Publicado el 11 noviembre, 2020 5 minutos y 12 segundos de lectura

¿Están realmente relacionados?

Asociaciones

Si alguna vez ha visto un evento deportivo en la televisión, ha sido bombardeado con dependencias o asociaciones . Estos dos términos significan lo mismo en estadística, y en realidad no significan mucho.

Si está viendo un partido de béisbol, es posible que observe una estadística que parpadea en la pantalla que le indica que el jugador # 8 no ha marcado en sus últimas tres visitas al Wrigley Field de los Chicago Cubs. Eso es una asociación. Nada mas. No hay evidencia de que Wrigley Field haga que nuestro jugador de béisbol no pueda hacerlo bien cuando juega contra los Cachorros en Chicago, pero tampoco hay pruebas de que no haya algo en Chicago que haga a nuestro jugador menos productivo. Simplemente no lo sabemos. Solo sabemos que existe una relación entre dos cosas, pero nada más que eso.

Correlaciones

Pero, ¿y si cambiamos un poco las condiciones de nuestra declaración? Modifiquemos esa estadística para decir que el # 8 no ha pegado un jonrón a un lanzador zurdo en más de 230 juegos. Interesante. Especialmente si su desempeño es mucho mejor contra lanzadores diestros. Ahora tenemos una correlación . Una correlación es un poco más definitiva que una asociación porque existe al menos la posibilidad de una relación causal. Todavía no lo sabemos con certeza, pero es mucho más probable que nuestro bateador tenga problemas contra los lanzadores zurdos que es probable que el Fantasma de Wrigley Field le esté dando mala suerte.

Causas

Sin embargo, todavía no estamos seguros de la verdadera causa de la mala suerte del bateador. Puede que haya una conexión con el lanzador, pero también podría ser otra cosa, tal vez incluso algo más que no conocemos. Si lo encontramos, la relación se llamaría relación causal .

Como era de esperar, esos son realmente difíciles de establecer. La mayoría de las veces, se necesitan métodos de prueba estadísticos que superan con creces la capacidad de una empresa para establecer una relación causal incuestionable, por lo que una matriz de correlación es la mejor opción.

Usar Excel para construir una matriz de correlación

Aunque una matriz de correlación no necesariamente responderá a la pregunta causal con autoridad, es muy posible que nos acerque lo suficiente. Usemos Excel para ejecutar una matriz muy simple usando solo dos variables. Para este ejemplo, nuestras preguntas de investigación son sobre agentes de policía. Queremos saber si los oficiales que obtuvieron mejores puntajes en su examen de polígrafo (prueba del detector de mentiras) pasaron más años en el departamento que los que obtuvieron puntajes más bajos. Nuestros datos brutos se ven así:

El tamaño de la muestra (n) es de 20 agentes. Sus puntajes de polígrafo y años de servicio están graficados en las columnas.
Figura 1

Para ejecutar la correlación, navegamos a la pestaña Datos y luego seguimos la barra de menú completamente hacia la derecha hasta que veamos la opción de Análisis de datos .

La pestaña de datos.
Figura 2

La pestaña de análisis de datos.
Fig. 3

Una vez que haya hecho clic en el botón para el análisis de datos, elija la correlación como tipo de análisis. Luego, especifique las celdas que contienen sus datos sin procesar.

Elija correlación como tipo de análisis.
Fig9

Luego, seleccione el rango de celdas que contienen los datos sin procesar.
Fig5

Ahora puede hacer clic en Aceptar y ejecutar la correlación. Su matriz debería verse como la siguiente:

Después de ejecutar el comando de correlación, debería ver una tabla similar a esta.
Fig6

Interpretación de los resultados

En aras de la simplicidad, utilizamos un conjunto de datos de ejemplo muy sencillo. Solo estamos correlacionando dos variables : puntaje del polígrafo y años de servicio. Las variables son los elementos de datos que estamos viendo que pueden cambiar un número infinito de veces.

Generalizando los valores resultantes, se pueden hacer interpretaciones usando esta tabla.
Fig7

El coeficiente de correlación de Pearson resultante ( r ) puede ser cualquier valor entre -1 y +1. En general, cuanto más se acerca r a 0, es menos probable que exista una relación. La inversa también es cierta. Cuando r está más cerca de -1 o +1, la probabilidad de una correlación significativa es mayor.

En el contexto de utilizar una correlación de Pearson para confirmar o rechazar una relación, tanto los valores positivos como los negativos pueden indicar una relación. Un valor positivo significa que cuando X sube, Y también lo hará. En el caso de un valor negativo, ocurre lo contrario. Todavía hay una relación, pero cuando X sube, Y baja.

La tabla anterior ofrece una descripción general rápida de los valores r con su significado asociado (o falta de él) para nuestros datos. Con r = .88, podemos interpretar con seguridad que los datos indican que recibir puntajes más altos en un examen de polígrafo puede correlacionarse con una mayor longevidad en el departamento. Una relación causal requeriría que averigüáramos por qué esto era cierto, pero para una correlación, es suficiente saber que es cierto, incluso si no sabemos por qué. Con una relación tan fuerte, podemos suponer que es probable que estas dos variables estén estrechamente relacionadas.

Resumen de la lección

Todas las empresas necesitan datos de alta calidad para poder tomar las mejores decisiones comerciales. Las herramientas estadísticas como una matriz de correlación pueden ayudar a visualizar los datos y brindar información sobre la credibilidad de esos datos. Las asociaciones son las relaciones más débiles porque son simplemente puntos de datos que interactúan en algún lugar por alguna razón. Las correlaciones son mejores porque nos dan la naturaleza precisa de la relación en lugar de simplemente confirmar que parece existir. Las relaciones causales son complejas de probar y generalmente están fuera del alcance de la inteligencia empresarial.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador