Creación e interpretación de diagramas de dispersión: proceso y ejemplos

Publicado el 31 octubre, 2020 por Rodrigo Ricardo

Explicación de los diagramas de dispersión

Liam es un jugador de fútbol que se prepara para participar en su equipo universitario de secundaria. Cada noche jugará con un grupo diferente de jugadores. Liam registra su tiempo de práctica durante el día y la cantidad de goles que hace cada noche.

Liam se pregunta si hay una forma de mostrar visualmente esta información y analizar la relación entre la cantidad de horas que practica y la cantidad de goles que logra. Liam puede hacer esto creando un diagrama de dispersión. Un diagrama de dispersión es un gráfico de pares ordenados que muestra una relación entre dos conjuntos de datos. En esta lección, aprenderá a interpretar datos bivariados para crear diagramas de dispersión.

Entendiendo los diagramas de dispersión

Al crear un diagrama de dispersión, verá dos conjuntos de datos. Estos datos se conocen como datos bivariados , que son dos conjuntos de variables que pueden cambiar y se comparan para encontrar relaciones.

Eche un vistazo a este gráfico:


Gráfico de datos bivariados
gráfico de datos bivariados

Observe que hay un eje x (la línea horizontal en un gráfico) y un eje y (la línea vertical en un gráfico). Cada punto de este gráfico se denomina par ordenado, que son dos números que indican una ubicación en el plano de coordenadas. El primer número es la ubicación en el eje x , y el segundo número es la ubicación en el eje y .

Este gráfico representa la relación entre la cantidad de horas que practicó Liam y la cantidad de goles que hizo cada noche durante la práctica. Esto se llama correlación , que es la relación entre dos variables o conjuntos de datos. Observe que cuantas más horas pasa Liam practicando, más goles hace esa noche.

Cada par ordenado es el número de horas de práctica y el número de goles. Este par ordenado representa la cantidad de horas que Liam pasó practicando el martes y la cantidad de goles que hizo el martes por la noche. Cuando crea un diagrama de dispersión, cada conjunto de variables debe tener algo en común. En este caso, las variables tienen en común a Liam y el día que Liam practicó. No podemos crear un par ordenado a partir de las horas de práctica de otra persona y la cantidad de goles de Liam. ¡No tienen nada en común!

Crear diagramas de dispersión

Idealmente, cuando crea un diagrama de dispersión, desea identificar las variables independientes y dependientes en el escenario. Una variable independiente es una condición o un dato en un experimento que se puede controlar o cambiar. En este caso, la variable independiente sería la cantidad de horas que Liam pasó practicando. Liam tiene control total sobre su tiempo de práctica. Una variable dependiente es una condición o un dato en un experimento que está controlado o influenciado por un factor externo, generalmente la variable independiente.

En este caso, la variable dependiente sería el número de goles que hace Liam durante el juego. Ahora, podría argumentar que Liam tiene control sobre la cantidad de goles que hace y, por lo tanto, los goles también serían una variable independiente, y esto es cierto. Sin embargo, Liam no puede simplemente pedir un deseo para mejorar su desempeño, ¿verdad? ¡Tiene que practicar para mejorar! Por lo tanto, la única forma en que Liam puede controlar su desempeño y mejorarlo es aumentando su tiempo de práctica, y ahí es donde obtenemos la relación entre las variables independientes y dependientes. Asegúrese de que cuando cree una gráfica de dispersión, coloque la variable independiente en el eje x y la variable dependiente en el eje y .

Para crear un diagrama de dispersión, desea observar de cerca sus dos conjuntos de datos. Liam ahora está rastreando dos conjuntos de datos diferentes: su tiempo de práctica y su resistencia. Quiere ver cuánto tiempo puede correr cada noche después de practicar por la mañana. Eche un vistazo a la tabla que ha creado Liam:

Día Horas de práctica Tiempo de resistencia
lunes 1 5
martes 2 10
miércoles 1 8
jueves 3 15
viernes 2 12
sábado 3 6

¿Podemos hacer un diagrama de dispersión a partir de estos datos? ¡Absolutamente!

Primero, cree pares ordenados a partir de las dos variables. En este caso, queremos poner las horas de práctica en el eje x y el tiempo de resistencia en el eje y . Por lo tanto, el primer conjunto de números, 2 y 10, constituirían nuestro primer par y así sucesivamente.

Luego, traza cada punto en tu gráfica. Esto mostrará si existe una correlación entre sus dos variables. Si los puntos parecen moverse en la misma dirección y están muy juntos, es probable que tengan una correlación. Observe que la mayoría de los puntos aumentan tanto vertical como horizontalmente:


Diagrama de dispersión de datos
diagrama de dispersión de datos de ejemplo

Cuando un conjunto de datos bivariados muestra un aumento general en números como este, se denomina correlación positiva , donde las variables dependientes y las variables independientes en un conjunto de datos aumentan juntas. Si el gráfico se inclinó hacia abajo, como los datos bivariados en el gráfico a continuación, entonces tiene un conjunto de datos con una correlación negativa .


Correlación negativa
diagrama de dispersión que muestra una correlación negativa

Si no hay relación entre los números, como se muestra en el gráfico a continuación, entonces el conjunto de datos no tiene correlación. Hablaremos más sobre esto en capítulos posteriores, ¡así que asegúrese de revisar las otras lecciones de este capítulo!


Sin correlación
diagrama de dispersión sin correlación

Resumen de la lección

Un diagrama de dispersión es un gráfico de pares ordenados que muestra una relación entre dos conjuntos de datos. Al crear una gráfica de dispersión, tendrá dos conjuntos de información, conocidos como datos bivariados , que son dos conjuntos de variables que pueden cambiar y se comparan para encontrar relaciones.

Cada punto de este gráfico se denomina par ordenado , que son dos números que indican una ubicación en el plano de coordenadas. El primer número es la ubicación en el eje x , y el segundo número es la ubicación en el eje y . Para crear un diagrama de dispersión, primero cree pares ordenados a partir de las dos variables. Coloque la variable independiente en el eje x y la variable dependiente en el eje y .

Luego, traza cada punto en tu gráfica. Esto mostrará si existe una correlación entre sus dos variables. Si los puntos parecen moverse en la misma dirección y están muy juntos, es probable que tengan una correlación .

Los resultados del aprendizaje

Una vez que haya completado esta lección, podrá:

  • Definir gráficos de dispersión y datos bivariados
  • Explica cómo crear una gráfica de dispersión de datos bivariados.
  • Diferenciar entre variables independientes y dependientes
  • Describir los diferentes tipos de correlación que se pueden ver en un diagrama de dispersión.

Articulos relacionados