Creación e interpretación de gráficos de puntos: procesos y ejemplos

Publicado el 14 noviembre, 2020 por Rodrigo Ricardo

Usar diagramas de puntos

Jason es escritor de una revista local. Está recopilando investigaciones sobre algunas de las tendencias entre los estudiantes universitarios. Jason pregunta a los estudiantes sobre sus bocadillos de estudio favoritos, qué hacen para relajarse, cuántas horas pasan estudiando y cuántas horas trabajan durante la semana. Jason quiere organizar esta información de una manera visual que muestre la popularidad de cada opción. Jason puede hacer esto creando un diagrama de puntos.

En esta lección, aprenda a crear e interpretar un diagrama de puntos para analizar visualmente sus datos.

¿Qué es un diagrama de puntos?

Un diagrama de puntos es una representación visual de datos usando intervalos o categorías de variables; los puntos representan una observación en los datos.

Se puede utilizar un diagrama de puntos para analizar la frecuencia en una distribución de datos. Los datos de Jason tienen que ver con la frecuencia. Él está haciendo preguntas sobre la frecuencia o cantidad de estudiantes que seleccionan cada opción. Un diagrama de puntos puede decirle rápida y fácilmente qué tan popular es una determinada opción o elemento en su conjunto de datos. Eche un vistazo a los resultados de la encuesta de Jason:


Datos de la Encuesta
tabla con resultados de la encuesta

Observe que hay dos tipos distintos de datos. Hay números, como el número de horas de estudio o el número de horas de trabajo; y hay cosas o categorías, como los bocadillos y las actividades de relajación.

Estos dos tipos diferentes de datos son categóricos y numéricos. Los datos categóricos son datos que se agrupan por tipo u objeto, no por números. Los datos numéricos son información que se puede medir. Siempre se recopila en forma numérica. Veamos diferentes ejemplos de datos numéricos y categóricos al crear un diagrama de puntos.

Crear un gráfico de puntos

Al crear un diagrama de puntos, primero etiquete todas las categorías de datos. Si está trabajando con datos categóricos, estas serán las opciones que se proporcionaron en el conjunto de datos. Por ejemplo, Jason preguntó a los estudiantes universitarios qué bocadillos preferían. Por lo tanto, las categorías en este diagrama de puntos serían Twizzlers, Payday, Doritos, Honey Buns, Whoppers, Hershey y Skittles.

A continuación, coloque una línea divisoria en la parte superior de sus categorías. Esto separará los datos de las etiquetas.


Diagrama de puntos para estudiar los datos de la merienda
diagrama de puntos de los datos de la merienda del estudio

Finalmente, coloque un punto para cada selección en su conjunto de datos. Notarás que hay tres puntos encima de la opción Twizzlers. Por lo tanto, tres personas seleccionaron Twizzlers como su bocadillo de estudio favorito. Cada punto representa a una persona que seleccionó esa opción.

Este es el diagrama de puntos de Jason para lo que hacen los estudiantes universitarios para relajarse:


Diagrama de puntos de la actividad de relajación
diagrama de puntos de la actividad de relajación

Observe que tres estudiantes seleccionaron dormir como su método preferido de relajación, dos estudiantes seleccionaron ver televisión y un estudiante cada uno seleccionado ir al cine, pasar el rato con amigos y volver a casa.

Tenga en cuenta que este diagrama de puntos contiene etiquetas de números en lugar de categorías:


Diagrama de puntos que muestra horas de estudio
diagrama de puntos que muestra el tiempo de estudio

Esto se debe a que este conjunto de datos es numérico en lugar de categórico. Cada número representa la cantidad de horas que cada estudiante dedica a estudiar cada semana. Cada punto representa al estudiante que eligió esa opción. Observe que no hay puntos en las etiquetas cero y tres. Eso significa que ningún estudiante seleccionó cero o tres horas como la cantidad de horas que dedican cada semana a estudiar.

Este es otro ejemplo de datos numéricos:


Diagrama de puntos de horas de trabajo
diagrama de puntos de horas de trabajo

Este diagrama de puntos representa el conjunto de datos cuando Jason preguntó a los estudiantes cuántas horas trabajaban cada semana. Observe que tres estudiantes seleccionaron cero, lo que probablemente le diría a Jason que no funcionan.

Interpretación de un diagrama de puntos

Jason ahora está realizando una segunda entrevista para un artículo de seguimiento. Sus lectores quieren conocer la siguiente información:

  1. Edades de 20 estudiantes universitarios encuestados
  2. Número de horas de clase que estaba tomando cada estudiante
  3. Cantidad de dinero gastada en libros en este semestre

Cuando analiza diagramas de puntos con datos numéricos, puede analizar la forma de ese diagrama de puntos en particular. Su diagrama de puntos puede ser simétrico o sesgado.

La simetría es donde la forma creada se refleja casi perfectamente a través de una línea. En estadística, encontrará que las representaciones visuales de datos serán casi perfectas, pero no siempre perfectas. Por eso definimos la simetría como casi perfecta. Cuando un conjunto de datos es simétrico, entonces la media, la mediana y la moda ocurren en el mismo punto. La media es la media. La mediana es el valor medio. El modo es el número que aparece más.

Este es un ejemplo de un diagrama de puntos que es simétrico:


Gráfico de puntos simétrico
diagrama de puntos que muestra datos simétricos

Observe que la opción del medio es la más alta y que cada lado de la opción del medio refleja el otro lado. Esto nos dice que la media, la mediana y la moda del conjunto de datos de Jason son 20.

Bien, si su diagrama de puntos no es simétrico, entonces podría estar sesgado , que es cuando la forma de un gráfico alcanza su punto máximo hacia la izquierda o hacia la derecha del centro. Si un diagrama de puntos muestra asimetría, entonces los datos se consideran sesgados hacia la izquierda o hacia la derecha. Las distribuciones que están sesgadas hacia la derecha tienen menos observaciones, o números, que son valores más altos.

Este es un ejemplo de un diagrama de puntos que está sesgado a la derecha:


Gráfico de puntos sesgado a la derecha
diagrama de puntos que está sesgado a la derecha

Observe que más personas encuestadas están tomando entre 12 y 14 horas que entre 15 y 18 horas.

Las distribuciones que están sesgadas hacia la izquierda tienen menos observaciones, o números, que son valores más bajos. Este es un ejemplo de un diagrama de puntos que está sesgado a la izquierda:


Diagrama de puntos sesgado a la izquierda
diagrama de puntos con datos sesgados a la izquierda

Observe que la mayoría de las observaciones están a la derecha, lo que nos indica que más personas tienen que gastar entre $ 500 y $ 700 en libros.

Puede saber si los datos están sesgados hacia la izquierda o hacia la derecha mirando la cola de los datos.

Si la cola está en el lado izquierdo del gráfico, entonces la distribución está sesgada hacia la izquierda. Si la cola está en el lado derecho del gráfico, entonces la distribución está sesgada a la derecha.

Resumen de la lección

Un diagrama de puntos es una excelente manera de crear una representación visual de datos, especialmente cuando se analiza la frecuencia en una distribución de datos. Un diagrama de puntos es una representación visual de datos usando intervalos o categorías de variables; los puntos representan una observación en los datos. Para crear un diagrama de puntos, simplemente enumere sus etiquetas o categorías. Luego, dibuja una línea en la parte superior de las categorías. Finalmente, coloque un punto sobre cada categoría para cada observación en el conjunto de datos.

Hay dos tipos diferentes de datos: categóricos y numéricos. Los datos categóricos son datos que se agrupan por tipo u objeto, no por números. Los datos numéricos son información que se puede medir. Siempre se recopila en forma numérica.

Al analizar datos numéricos, encontrará que la distribución puede ser simétrica , donde la forma creada se refleja casi perfectamente a través de una línea. Los datos no siempre son perfectamente simétricos, pero pueden acercarse mucho. Cuando un conjunto de datos es simétrico, entonces la media, la mediana y la moda ocurren en el mismo punto.

Su distribución también podría estar sesgada , que es donde la forma de un gráfico alcanza su punto máximo a la izquierda o la derecha del centro. Las distribuciones que están sesgadas hacia la derecha tienen menos observaciones, o números, que son valores más altos. Las distribuciones que están sesgadas hacia la izquierda tienen menos observaciones, o números, que son valores más bajos. Puede recordar esto observando la cola de los datos. Los gráficos de puntos son una excelente manera de visualizar las distribuciones de frecuencia en un conjunto de datos, así que utilícelos si desea mostrar este tipo de datos.

Los resultados del aprendizaje

Una vez que haya terminado con esta lección, podrá:

  • Definir el diagrama de puntos e identificar el propósito de usar diagramas de puntos
  • Resumir cómo crear un diagrama de puntos
  • Diferenciar entre datos categóricos y numéricos
  • Describir cómo se ve un diagrama de puntos simétrico y qué significa para los datos.
  • Explicar lo que se entiende por sesgado y lo que significa sesgado hacia la izquierda o hacia la derecha para los datos.

Articulos relacionados