Creación e interpretación de diagramas de caja: procesos y ejemplos

Publicado el 3 noviembre, 2020 por Rodrigo Ricardo

Observación y análisis de datos

Isabel es directora de noticias en una estación de televisión local. Ella acaba de contratar a dos nuevos presentadores para su noticiero del mediodía. Dos semanas después, el jefe de Isabel quiere reunirse con ella sobre los nuevos presentadores. No está seguro de si a la audiencia le gusta el cambio. Isabel realiza una encuesta a un grupo aleatorio de 15 personas, pidiéndoles que clasifiquen las anclas en una escala del 1 al 10, siendo 10 el mejor y 1 el peor. Estos son los rangos que obtuvo en la encuesta:

3, 3, 7, 8, 7, 4, 4, 10, 1, 5, 1, 7, 2, 7, 9

Isabel ahora necesita analizar estos datos. Puede usar un diagrama de caja para visualizar los datos.

Analizar un diagrama de caja

Un diagrama de caja es una representación gráfica de la distribución en un conjunto de datos utilizando cuartiles, valores mínimo y máximo en una recta numérica.

nulo

Este es un ejemplo de diagrama de caja. Para comprender los diferentes elementos de un diagrama de caja, debe comprender los cuartiles, el rango intercuartílico y la mediana.

Un cuartil es un grupo de valores y / o medios que dividen un conjunto de datos en cuartos o grupos de cuatro. No se confunda aquí; un cuartil es un valor, no un grupo de números. Piense en un cuartil como un “punto de corte” para cada grupo. Un grupo tiene que comenzar y detenerse en algún lugar, y eso es exactamente lo que hace un cuartil.

El rango intercuartil es un valor que es la diferencia entre el valor del cuartil superior y el valor del cuartil inferior.

La mediana es el valor del punto medio de un conjunto de datos, donde los valores se organizan en orden ascendente o descendente.

Para obtener más información sobre los cuartiles, consulte nuestro capítulo sobre resumen de datos.

Primero, veamos algunas de las piezas y partes de un diagrama de caja. Echale un vistazo a éste ejemplo.

nulo

Lo primero que puede notar es el cuadro violeta en el lado derecho del gráfico que se encuentra directamente encima de la recta numérica. Este cuadro representa el rango intercuartílico. La línea que crea el lado izquierdo del cuadro representa el cuartil inferior o cuartil 1, y la línea que crea el lado derecho del cuadro representa el cuartil superior o cuartil 3.

La línea en el medio del cuadro, ligeramente a la izquierda, es la mediana. La línea vertical en el extremo izquierdo es el valor mínimo extremo y la línea vertical en el extremo derecho es el valor máximo extremo. Estos son los números más pequeños y más grandes del conjunto de datos. Finalmente, la línea que se extiende horizontalmente desde el mínimo extremo al máximo extremo representa el rango del conjunto de datos.

También puede notar que el mínimo extremo está bastante lejos de la caja, y la caja está ubicada más a la derecha. Esto significa que los datos están parcialmente sesgados y que el mínimo extremo es un valor atípico.

Crear un diagrama de caja

Echemos otro vistazo al conjunto de datos de Isabel:

3, 3, 7, 8, 7, 4, 4, 10, 1, 5, 1, 7, 2, 7, 9

Para crear un diagrama de caja, necesitamos encontrar los cuartiles y los valores mínimo y máximo. Primero, necesitamos ordenar los datos de menor a mayor, así:

1, 1, 2, 3, 3, 4, 4, 5, 7, 7, 7, 7, 8, 9, 10

Con solo mirar este orden, podemos ver que nuestro mínimo extremo, o nuestro valor mínimo, es 1 y nuestro máximo extremo, o nuestro valor máximo, es 10.

Ahora necesitamos encontrar la mediana de este conjunto de datos. Nuestro valor mediano es 5.

Ahora necesitamos encontrar el cuartil 1 y el cuartil 3. Nuestro primer cuartil es 3. Nuestro tercer cuartil es 7. Ahora podemos usar todos estos puntos y graficarlos en nuestra recta numérica.

Primero, dibuje una recta numérica con los números positivos del 1 al 10. Estamos usando estos números porque son nuestro mínimo y máximo extremos. Ahora, grafique todos sus puntos, 1, 3, 5, 7 y 10. De izquierda a derecha, está mirando su mínimo extremo, cuartil 1, mediana, cuartil 3 y máximo extremo.

nulo

En segundo lugar, dibuje una línea vertical sobre la línea numérica en los puntos 1 y 10. Conecte esas líneas con una línea horizontal. Tercero, dibuja un cuadro que cubra la línea horizontal, con el borde izquierdo en 3 y el borde derecho en 7. Este es tu rango intercuartílico.

nulo

Cuarto, dibuja una línea vertical en la parte superior de tu caja en 5. Esta es tu mediana.

nulo

A partir de estos datos, podemos ver que la audiencia, o al menos las personas encuestadas, piensa que los presentadores están bien pero no son geniales.

Resumen de la lección

Hay muchas formas de analizar datos. Crear un diagrama de caja es una excelente manera de visualizar sus datos y comprender qué significan los datos. Al crear un diagrama de caja, debe comprender cada elemento.

El cuadro del gráfico que se encuentra directamente encima de la recta numérica representa el rango intercuartil. El rango intercuartil es un valor que es la diferencia entre el valor del cuartil superior y el valor del cuartil inferior.

La línea que crea el lado izquierdo del cuadro representa el cuartil inferior, o cuartil 1, y la línea que crea el lado derecho del cuadro representa el cuartil superior o cuartil 3. Un cuartil es un grupo de valores o significa que divida un conjunto de datos en cuartos o grupos de cuatro.

La línea en el medio del cuadro es la mediana. La mediana es el valor del punto medio de un conjunto de datos, donde los valores se organizan en orden ascendente o descendente.

La línea vertical en el extremo izquierdo es el valor mínimo extremo y la línea vertical en el extremo derecho es el valor máximo extremo. Estos son los números más pequeños y más grandes del conjunto de datos.

Finalmente, la línea que se extiende horizontalmente desde el mínimo extremo al máximo extremo representa el rango del conjunto de datos. Si el valor máximo extremo o mínimo extremo se encuentra lejos del diagrama de caja, es posible que sus datos estén sesgados.

Resultado de aprendizaje

Al final de esta lección, debería poder crear e interpretar un diagrama de caja.

Articulos relacionados