Distribución sesgada: ejemplos y definición

Rodrigo Ricardo Publicado el 23 noviembre, 2020 4 minutos y 49 segundos de lectura

Datos sesgados

Imagina que estás interesado en estudiar los ingresos anuales de los estudiantes un año después de haber completado su Maestría en Administración de Empresas (MBA). Recopila datos de 400 graduados y descubre que sus ingresos anuales oscilan entre $ 20 000 y $ 150 000. Esta tabla resume los datos que ha recopilado.

Ingresos de los graduados de MBA
Tabla de datos

Digamos que también está interesado en examinar el número de solicitudes que completó cada graduado antes de encontrar su trabajo actual. Con los datos recopilados de los mismos 400 graduados, encontrará que el número de solicitudes que completaron varía de 1 a 15. Esta tabla resume los datos que ha recopilado.

Número de solicitudes enviadas antes de encontrar trabajo
tabla de datos

Probablemente no pueda saberlo mirando las tablas, pero los datos que recopiló en los dos estudios anteriores están sesgados.

¿Qué es una distribución sesgada?

Se dice que una distribución está sesgada cuando los puntos de datos se agrupan más hacia un lado de la escala que hacia el otro, creando una curva que no es simétrica. En otras palabras, el lado derecho e izquierdo de la distribución tienen formas diferentes entre sí. Hay dos tipos de distribuciones sesgadas.

Una distribución está sesgada positivamente si los puntajes caen hacia el lado inferior de la escala y hay muy pocos puntajes más altos. Los datos con sesgo positivo también se denominan sesgados a la derecha porque esa es la dirección del «extremo largo» del gráfico. Creemos un cuadro utilizando los datos de ingresos anuales que recopilamos de los graduados de MBA.

gráfico de datos que muestra una distribución sesgada positivamente

Puede ver que la mayoría de los graduados reportaron ingresos anuales entre $ 31,000 y $ 70,000. Puede ver que hay muy pocos graduados que ganan más de $ 70,000. El ingreso anual de los graduados de MBA está sesgado positivamente, y el «extremo largo» del gráfico apunta a la derecha.

Una distribución está sesgada negativamente si las puntuaciones caen hacia el lado más alto de la escala y hay muy pocas puntuaciones bajas. Echemos un vistazo a la tabla del número de solicitudes que completó cada graduado antes de encontrar su trabajo actual.

Gráfico de datos que muestra una distribución sesgada negativamente

Podemos ver que la mayoría de los graduados completaron entre 9 y 13 solicitudes. Solo 56 de los 400 graduados completaron menos de 9 solicitudes. El número de solicitudes completadas para los graduados de MBA está sesgado negativamente, y el «extremo largo» apunta a la izquierda. Los datos con sesgo negativo también se denominan «sesgados a la izquierda» porque esa es la dirección del «extremo largo».

Características de las distribuciones sesgadas

Probablemente esté familiarizado con la media, la mediana y la moda. La moda es la puntuación que ocurre con más frecuencia en una distribución. La mediana es el valor medio que separa el 50% superior de la distribución del 50% inferior. La media es el promedio que se obtiene sumando todos los puntajes y dividiendo la suma por el número total de puntajes.

La media, la mediana y la moda son medidas de tendencia central que se utilizan para describir un conjunto de datos. Aquí hay algunos puntos clave para recordar:

  • En una distribución con sesgo positivo, la media suele ser mayor que la mediana porque las pocas puntuaciones altas tienden a desplazar la media hacia la derecha.
  • En una distribución sesgada negativamente, la media suele ser menor que la mediana porque las pocas puntuaciones bajas tienden a desplazar la media hacia la izquierda.
  • En una distribución con sesgo positivo, la moda siempre es menor que la media y la mediana. Esto se debe a que la moda es el punto en el eje x correspondiente al punto más alto, y el punto más alto en una distribución con sesgo positivo siempre estará en el lado inferior.
  • En una distribución sesgada negativamente, la moda siempre es mayor que la media y la mediana, y el punto más alto de una distribución sesgada negativamente siempre estará en el lado derecho.

Hay algunos datos que están naturalmente sesgados. Por ejemplo, la edad de jubilación está sesgada negativamente, ya que la mayoría de las personas no tienden a jubilarse hasta los 60 años y muy pocas personas se jubilan antes de esa fecha. El número de niños en hogares estadounidenses es un ejemplo de datos que están sesgados positivamente; la mayoría de los hogares estadounidenses tienen entre cero y cinco hijos, y hay muy pocos hogares con seis o más hijos. Los ingresos familiares en los EE. UU. También están sesgados positivamente.

Resumen de la lección

Se dice que una distribución está sesgada cuando los puntos de datos se agrupan más hacia un lado de la escala que hacia el otro. Una distribución está sesgada positivamente , o sesgada hacia la derecha, si los puntajes caen hacia el lado inferior de la escala y hay muy pocos puntajes más altos. Una distribución está sesgada negativamente , o sesgada hacia la izquierda, si las puntuaciones caen hacia el lado superior de la escala y hay muy pocas puntuaciones bajas. En distribuciones con sesgo positivo, la media suele ser mayor que la mediana , que siempre es mayor que la moda . En distribuciones con sesgo negativo, la media suele ser menor que la mediana, que siempre es menor que la moda.

Los resultados del aprendizaje

Una vez que haya terminado con esta lección, debería poder:

  • Explica cómo los datos se pueden desviar
  • Recordar la apariencia e identificar datos sesgados positiva y negativamente
  • Describa cómo la media, la mediana y la moda pueden indicar si los datos están sesgados positiva o negativamente

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador