Representaciones visuales de un conjunto de datos: forma, simetría y sesgo

Rodrigo Ricardo Publicado el 18 septiembre, 2020 5 minutos y 25 segundos de lectura

Representaciones visuales de un conjunto de datos

Katelyn es meteoróloga en una estación de televisión local. Ella ha estado monitoreando los datos sobre las altas temperaturas de las últimas dos semanas. Katelyn quiere usar representaciones gráficas de estos datos para mostrar a sus espectadores lo que está sucediendo con el clima. Ella puede hacer esto usando representaciones visuales de los datos y discutiendo la forma, simetría y asimetría de los datos. Echemos un vistazo al conjunto de datos de los espectadores de Katelyn. He organizado estos datos en orden ascendente: 72, 74, 74, 75, 75, 76, 76, 76, 77, 77, 78, 78, 79.

Ahora veamos algunas representaciones visuales de estos datos, pero antes de hacerlo, necesitamos definir algunos términos clave. Al mirar una representación visual de un conjunto de datos, debe buscar dos cosas diferentes: simetría y asimetría. A veces la representación será simétrica, donde la forma creada se refleja casi perfectamente a través de una línea. En estadística, encontrará que las representaciones visuales de datos serán casi perfectas, pero no siempre perfectas. Por eso definimos la simetría como casi perfecta. Cuando un conjunto de datos es simétrico, entonces la media, la mediana y la moda ocurren en el mismo punto. Esto se considera distribución normal; no entraremos en la distribución normal en esta lección, pero consulte nuestras otras lecciones para obtener más información. Es importante tener en cuenta la simetría de datos al trabajar con distribuciones.

Bien, si su representación visual de un conjunto de datos no es simétrica, entonces podría estar sesgada , que es donde la forma de un gráfico alcanza su punto máximo a la izquierda o la derecha del centro. Si una representación visual muestra asimetría, entonces los datos no se distribuyen normalmente y se consideran sesgados hacia la izquierda o hacia la derecha. Las distribuciones que están sesgadas a la derecha tienen menos observaciones, o números, que son valores más altos, mientras que las distribuciones que están sesgadas a la izquierda tienen menos observaciones o números que son valores más bajos. Puede recordar esto observando la cola de los datos. Si la cola está en el lado izquierdo del gráfico, entonces la distribución está sesgada hacia la izquierda. Si la cola está en el lado derecho del gráfico, entonces la distribución está sesgada a la derecha.

Analizar representaciones visuales de datos

Este es un gráfico de las altas temperaturas que Katelyn observó durante las últimas dos semanas:

Gráfico de altas temperaturas
gráfico de temperaturas por ejemplo

El eje horizontal representa la temperatura, mientras que el eje vertical representa el número de días que se observó la temperatura. Observe que hay un pico central en este gráfico con cada lado del pico reflejando el otro. Esta es una distribución de datos simétrica. La media, la mediana y la moda de este conjunto de datos son 76.

Este es un gráfico de las bajas temperaturas que Katelyn observó durante el último mes:

Gráfico de bajas temperaturas
gráfico de baja temperatura, por ejemplo

Observe que la mayoría de las observaciones se concentran en el lado izquierdo del gráfico. Además, observe que no hay días que hayan tenido una temperatura baja de 62 grados. A esto se le llama brecha en los datos. Una brecha es un área en el conjunto de datos donde no se han realizado observaciones. Por lo tanto, estos datos están sesgados a la derecha y tienen una brecha en la distribución.

Ahora Katelyn está analizando los datos de humedad. Ha recopilado información sobre las últimas dos semanas de humedad. Sin embargo, está confundida por la forma en que se ven los datos en el gráfico. El lado izquierdo del gráfico casi parece simétrico, pero hay otra agrupación de datos hacia el lado derecho del gráfico. Estos datos son bimodales , donde el conjunto de datos tiene dos modos diferentes. Observe a continuación que el segundo pico es ligeramente más pequeño que el primer pico. Por tanto, estos datos no son simétricos y bimodales.

Gráfico bimodal no simétrico
gráfico bimodal no simétrico

Bien, eche un vistazo a este gráfico:

Gráfico para el último ejemplo
gráfico sesgado a la izquierda, por ejemplo

¿Cómo describiría estos datos basándose en la representación visual? Observe que la mayoría de las observaciones ocurren hacia la derecha y la cola está a la izquierda. Por lo tanto, tenemos una distribución de datos sesgada hacia la izquierda.

Resumen de la lección

Las representaciones visuales son una excelente manera de comprender los datos. Al analizar representaciones visuales, querrá comenzar buscando una de dos características en la forma del gráfico. Verá que el gráfico puede ser simétrico , donde la forma creada se refleja casi perfectamente a través de una línea. En estadística, encontrará que las representaciones visuales de datos serán casi perfectas, pero no siempre perfectas. Por eso definimos la simetría como casi perfecta. Cuando un conjunto de datos es simétrico, entonces la media, la mediana y la moda ocurren en el mismo punto.

Su gráfico podría estar sesgado, que es donde la forma de un gráfico alcanza su punto máximo a la izquierda o la derecha del centro. Si una representación visual muestra asimetría , entonces los datos no se distribuyen normalmente y se consideran sesgados hacia la izquierda o hacia la derecha. Las distribuciones que están sesgadas a la derecha tienen menos observaciones, o números, que son valores más altos, mientras que las distribuciones que están sesgadas a la izquierda tienen menos observaciones o números que son valores más bajos. Puede recordar esto observando la cola de los datos. Si la cola está en el lado izquierdo del gráfico, entonces la distribución está sesgada hacia la izquierda. Si la cola está en el lado derecho del gráfico, entonces la distribución está sesgada a la derecha.

Los resultados del aprendizaje

Una vez que haya terminado con esta lección, debería tener la capacidad de:

  • Identificar la importancia de las representaciones visuales de datos.
  • Describir gráficas simétricas y sesgadas.
  • Recuerde cómo saber si una gráfica está sesgada hacia la izquierda o hacia la derecha
  • Explique lo que significa cuando los datos tienen una brecha o son bimodales.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador