Muestra de media y varianza: definición, ecuaciones y ejemplos

Rodrigo Ricardo Publicado el 23 noviembre, 2020 4 minutos y 23 segundos de lectura

¿Qué altura tienen esos arbustos?

Tony es dueño de un vivero de plantas y uno de sus mayores vendedores son los arbustos de arándanos. Vende los arbustos a sus clientes cuando miden al menos 45 centímetros. Tony quiere saber cuánto tardará cada uno de sus arbustos de arándanos en crecer lo suficiente como para venderlos. Para obtener una estimación de este tiempo, selecciona diez plantas al azar y registra el número de días que cada una tarda en crecer desde una semilla hasta una planta de 18 pulgadas de alto.

Tiempo necesario para que cada planta crezca hasta 18 pulgadas de alto
datos de altura de la planta

Muestra promedio

Una muestra es un conjunto de medidas tomadas de una población más grande. En este caso, la población serían todos los arbustos de arándanos de Tony, y la tasa de muestreo solo incluiría los diez arbustos específicos que seleccionó para observar. Las medidas de Tony representan una muestra aleatoria porque se seleccionaron al azar de la población. Cada semilla tenía las mismas posibilidades de ser elegida para la muestra. Para que una muestra dé una buena aproximación de la población, debe seleccionarse al azar.

La media de la muestra es simplemente el promedio de todas las mediciones de la muestra. Si la muestra es aleatoria, entonces la media muestral se puede utilizar para estimar la media poblacional.

Aquí aparece la ecuación media muestral:

nulo

Para los datos de Tony, usamos esta ecuación reemplazando los valores; así que sumamos todos los datos (967/10 = 96,7), que, como puede ver aquí, nos da la media muestral de 96,7.

ejemplo de media de muestra

Varianza de la muestra

Otra estadística importante que se puede calcular para una muestra es la varianza de la muestra. La varianza mide qué tan dispersos están los datos en una muestra. Dos muestras pueden tener la misma media pero distribuirse de manera muy diferente. La varianza es una forma de cuantificar estas diferencias. La varianza de una muestra también está estrechamente relacionada con la desviación estándar , que es simplemente la raíz cuadrada de la varianza. El símbolo que se utiliza normalmente para representar la desviación estándar es s , por lo que el símbolo de la varianza es s 2 .

Para encontrar la varianza de la muestra, siga estos pasos:

  • Primero, calcule la media muestral.
  • Luego, reste el valor medio del valor de cada medición.
  • Cuadre los valores resultantes.
  • Suma los resultados para obtener la suma de las desviaciones cuadradas de la media.
  • Finalmente, divida esto por el número de grados de libertad, que es igual al número total de mediciones menos uno ( n -1)

En forma de ecuación, esto se ve así:

ecuación de varianza

La forma más sencilla de hacer esto es crear una tabla como esta:

tabla de varianza

Como podemos ver, para los datos de Tony, la varianza muestral es igual a 43.344.

La desviación estándar a menudo le brinda información más útil que la varianza. Se espera que alrededor del 70% de los valores en la población caigan dentro de una desviación estándar a cada lado de la media. Para encontrar la desviación estándar de la varianza, simplemente saque la raíz cuadrada.

ejemplo de desviación estándar

Dado que el número medio de días en la muestra de Tony fue 96,7, puede esperar que alrededor del 70% de sus árboles alcancen las 18 pulgadas de alto entre 90 días y 103 días.

Muestras reales vs ideales

Idealmente, las muestras se seleccionan al azar y, por lo tanto, representan con precisión a la población más grande. Sin embargo, en el mundo real, a veces es muy difícil obtener una muestra verdaderamente aleatoria. Casi siempre hay cierta cantidad de sesgo en la muestra, incluso si no es intencional.

Incluso en el caso de Tony y sus arbustos de arándanos, dado que está monitoreando esos diez arbustos con cuidado, puede darles más agua o controlarlos con más frecuencia que los demás. Incluso podría simplemente plantarlos uno cerca del otro y lejos de otros arbustos. Estas pequeñas diferencias podrían sesgar los datos, ¡aunque su intención sea que la muestra sea aleatoria!

Aunque es difícil obtener una muestra verdaderamente aleatoria, es importante hacer una muestra lo más aleatoria posible para que la media y la varianza de la muestra representen con precisión la media y la varianza de la población.

Resumen de la lección

Muy bien, tomemos un momento para revisar lo que hemos aprendido.

Una muestra contiene datos recopilados de individuos seleccionados tomados de una población más grande. También aprendimos que la media muestral es el promedio aritmético de todos los valores de la muestra.

nulo

La varianza de la muestra mide la dispersión de los datos y la desviación estándar de la muestra es la raíz cuadrada de la varianza.

ecuación de varianza

Si la muestra es aleatoria y está distribuida normalmente, entonces la media de la muestra debe ser una buena aproximación de la media de la población, y aproximadamente el 70% de la población debe estar dentro de una desviación estándar de la media.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador