Variabilidad en la estadística: definición y medidas

Publicado el 14 septiembre, 2020

¿Qué es una variabilidad?

Imagine que está impartiendo un curso de psicología y desea examinar el desempeño de sus alumnos en los exámenes parciales y finales. Las calificaciones de sus estudiantes son las siguientes:

datos del estudiante

Tenga en cuenta que hay trece estudiantes en la clase y que se enumeran las calificaciones intermedias y finales de cada estudiante. Tenga en cuenta que solo hay un estudiante que recibió la misma calificación tanto en el parcial como en el final. Ahora desea saber si las calificaciones de los estudiantes en cada examen son similares entre sí o si las calificaciones están distribuidas. A esto se le llama variabilidad.

La variabilidad se refiere a la dispersión de un grupo de datos. En otras palabras, la variabilidad mide cuánto difieren sus puntajes entre sí. La variabilidad también se conoce como dispersión o extensión. Se dice que los conjuntos de datos con valores similares tienen poca variabilidad, mientras que los conjuntos de datos que tienen valores dispersos tienen una alta variabilidad.


El conjunto de datos B es más amplio y más disperso que el conjunto de datos A. Esto indica que el conjunto de datos B tiene más variabilidad.
ejemplo de variabilidad

Medidas de variabilidad

El rango es la medida más simple de variabilidad. Tomas el número más pequeño y lo restas del número más grande para calcular el rango. Esto muestra la propagación de nuestros datos. El rango es sensible a valores atípicos , o valores que son significativamente más altos o más bajos que el resto del conjunto de datos, y no debe usarse cuando existen valores atípicos.

Calculemos el rango de las calificaciones de los exámenes parciales. Aquí se muestran las calificaciones intermedias enumeradas en orden numérico. Dado que el rango es igual a la calificación intermedia más alta menos la calificación intermedia más baja, podemos encontrar fácilmente el rango para este conjunto de datos. Si ingresamos 100 para nuestra calificación intermedia más alta y 52 para nuestra calificación intermedia más baja, encontramos que el rango es igual a 100 menos 52, o 48.

  • Rango = calificación intermedia más alta menos calificación intermedia más baja
  • Rango = 100 – 52 = 48

Medidas de variabilidad: IQR

Entonces, ¿qué medida de variabilidad podemos usar cuando trabajamos con conjuntos de datos que contienen valores atípicos? Una solución es utilizar el rango intercuartílico (IQR) . El IQR, o medio cincuenta, es el rango para el medio cincuenta por ciento de los datos. El IQR solo considera valores medios, por lo que no se ve afectado por los valores atípicos.

  • IQR = Q3 -Q1

Para calcular el IQR, siga los siguientes pasos:

1) Enumere los datos en orden numérico. Enumerar los datos en orden numérico es necesario para encontrar el rango y la mediana.

2) Encuentra la mediana. En un conjunto de datos impares, la mediana es el valor medio que corta los datos a la mitad. Por ejemplo, en un conjunto de 13 datos, la mediana es el número en el séptimo lugar. En un conjunto de datos pares, la mediana es la media de los dos valores medios. Para este conjunto de datos, la mediana es 85.

3) Coloque corchetes alrededor de los números por encima y por debajo de la mediana, pero no alrededor de la mediana. Los corchetes separarán la mediana de Q1 y Q3. Entonces, para las calificaciones intermedias, nuestros datos ahora se verán así.

4) Ubique los cuartiles. Para los grados intermedios, Q1 es 52, 55, 71, 75, 81, 83. Y Q3 es 89, 90, 90, 99, 100, 100.

5) Encuentre la mediana de los datos en Q1. Tenemos un número par de puntos de datos en el primer trimestre, por lo que nuestra mediana será el promedio de los dos números del medio. En otras palabras, sumamos 71 a 75 y luego dividimos la suma por 2. La mediana es 73. Y este es nuestro valor Q1.

6) Encuentre la mediana de los datos en Q3. Para encontrar la mediana, repita lo que se hizo para Q1 pero con los valores en Q3. Podemos encontrar que Q3 es 94.5.

7) Encuentre el rango intercuartílico usando la fórmula IQR = Q3 – Q1. Reemplazando 73 para Q1 y 94.5 para Q3, encontraremos que IQR = 94.5 – 73 = 21.5. Por tanto, el rango intercuartil para este conjunto de datos es 21,5.

Medidas de variabilidad: varianza

La varianza es una medida de cuán cerca están las puntuaciones en el conjunto de datos a la media. La varianza se utiliza principalmente para calcular la desviación estándar y otras estadísticas. Hay cuatro pasos para calcular la varianza. Usemos las calificaciones del examen de mitad de período nuevamente, pero esta vez calcularemos la variación.

Eche otro vistazo a nuestros datos de mitad de período.

1) Encuentra la media del conjunto de datos. Para encontrar la media, suma para obtener la suma de todos los números del conjunto de datos. Divida la suma por 13. La media de las calificaciones del examen parcial es 82,31.

2) Reste la media de cada valor en el conjunto de datos. Para hacer esto, reste 82,31 de cada número en el conjunto de datos. Por ejemplo, la puntuación del estudiante es 71 y 71 menos 82,31 es 11,31 negativo. Continúe restando 82,31 de cada número en el conjunto de datos.

3) Ahora eleve al cuadrado cada uno de los valores para que tenga todos los valores positivos. Por ejemplo, la diferencia que obtuvimos antes era 11,31 negativo. Ese número al cuadrado nos da 127,86. Continúe elevando al cuadrado cada valor, luego sume los valores al cuadrado. La suma de los valores al cuadrado es 2922,77.

4) Finalmente, divida la suma de los cuadrados por el número total de valores en el conjunto para encontrar la varianza. Este conjunto de datos tiene 13 números, así que divida la suma de las diferencias al cuadrado por 13. La varianza es 2922,77 dividida por 13, o 224,83.

variabilidad a medio plazo

Medida de variabilidad: desviación estándar

La raíz cuadrada de la varianza se conoce como desviación estándar . Al igual que la varianza, la desviación estándar mide qué tan cerca están las puntuaciones en el conjunto de datos a la media. Sin embargo, la desviación estándar se mide exactamente en la misma unidad que el conjunto de datos. Encontremos la desviación estándar de las calificaciones de los exámenes parciales.

  • Desviación estándar = raíz cuadrada de la varianza

Con las calificaciones del examen de mitad de período, la variación fue de 224,83. La raíz cuadrada de 224,83 = 14,99.

  • Desviación estándar = la raíz cuadrada de 224,83 = 14,99

Encontrar variabilidad: interpretar los datos

Practiquemos el cálculo del rango, IQR, varianza y desviación estándar usando las calificaciones del examen final en la tabla.

Al encontrar el rango , recuerde enumerar primero los datos en orden numérico. Luego restamos el valor más pequeño del valor más grande. El rango es el número más grande del conjunto de datos restado del más pequeño, que es 100 – 69 o 31.

Para encontrar el IQR , primero tenemos que encontrar la mediana y ubicar Q1 y Q3. Para el conjunto de datos que se muestra, 88 es la mediana. Luego separe los cuartiles con corchetes. Después de determinar Q1 y Q3, encuentre las medianas de esos cuartiles que serán nuestros valores para Q1 y Q3. En cada cuartil, busque los dos números del medio, ya que cada cuartil tiene un conjunto de datos par. Deberíamos encontrar que Q1 = 79 y Q3 = 98. Ahora podemos insertar Q1 y Q3 en la fórmula. Si restamos la mediana de Q3 de Q1, obtendremos 98 – 79, o 19 para el IQR.

Para encontrar la varianza , comience por encontrar la media de las calificaciones del examen final y luego reste la media de cada valor en el conjunto de datos. Luego eleva al cuadrado cada valor y encuentra la suma de los cuadrados. Para encontrar la varianza, divida la suma de los cuadrados por 13. La varianza para este conjunto de datos es 103,51.

variabilidad final

Para encontrar la desviación estándar , todo lo que necesitamos hacer es sacar la raíz cuadrada de la varianza. Como sabemos que la varianza es 103,51, podemos calcular rápidamente que la desviación estándar es 10,17.

Las calificaciones intermedias en comparación con las calificaciones finales se ven así: la varianza intermedia es 224.83, el rango es 48 y 14.99 es la desviación estándar. Para las calificaciones finales, la varianza es 103.51, 31 es el rango y 10.17 es la desviación estándar.

Entonces, después de analizar las calificaciones de los estudiantes, se puede determinar que las calificaciones de medio término tienen una mayor varianza, rango y desviación estándar que las calificaciones finales. Podemos concluir que las notas intermedias tienen más variabilidad que las notas finales. También podemos concluir que las calificaciones del examen final son más similares entre sí que las calificaciones intermedias.

Debido a que las medidas de variabilidad son una forma de estadística descriptiva , solo pueden usarse para describir los datos en nuestro estudio. No se pueden utilizar para sacar conclusiones o hacer inferencias que vayan más allá de nuestro conjunto de datos.

Resumen de la lección

La variabilidad se refiere a la dispersión de un grupo de datos. Las medidas comunes de variabilidad son el rango, IQR, varianza y desviación estándar . Se dice que los conjuntos de datos con valores similares tienen poca variabilidad, mientras que los conjuntos de datos que tienen valores dispersos tienen una alta variabilidad. Cuando trabaje para encontrar la variabilidad, también necesitará encontrar la media y la mediana . Las medidas de variabilidad son estadísticas descriptivas que solo pueden usarse para describir los datos en un estudio o conjunto de datos dado.

Puntos para recordar

términos de variabilidad
  • Rango : la medida más simple de variabilidad; número más pequeño restado del número más grande para calcular el rango
  • Valores atípicos : valores significativamente más altos o más bajos que el resto del conjunto de datos
  • IQR : solo considera valores medios; no se ve afectado por los valores atípicos
  • Varianza : medida de qué tan cerca están las puntuaciones en el conjunto de datos a la media
  • Desviación estándar : la raíz cuadrada de la varianza.
  • Estadística descriptiva : solo se puede utilizar para describir los datos en estudio
  • Media : el promedio del total en un conjunto de datos
  • Mediana : el valor medio de un conjunto de datos.

Los resultados del aprendizaje

A medida que concluye la lección sobre variabilidad estadística, es posible que le resulte fácil:

  • Responda la pregunta “¿Qué es una variabilidad?”
  • Determine cómo encontrar el rango y los IQR
  • Resolver para media y media
  • Identificar una desviación estándar

¡Puntúa este artículo!