Varianza muestral: Cómo calcular la varianza muestral

Publicado el 29 septiembre, 2021

¿Qué son las estadísticas de muestra?

Aunque lo ideal sería calcular estadísticas para toda una población, es posible que esto no siempre sea posible debido a limitaciones de tiempo y / o dinero. Para remediar esto, se pueden calcular estadísticas de muestra para representar a toda la población. Las estadísticas de muestra son cualquier número calculado a partir de los datos que representan la muestra. Por ejemplo, es posible que un científico que estudie el éxito reproductivo en una especie de aves no pueda contar la cantidad de huevos en los 500 nidos en su sitio de estudio para incluir a toda la población.

Huevos en un nido

huevos en un nido

En cambio, este científico podría contar la cantidad de huevos en 100 nidos y calcular estadísticas de muestra, como la media (o promedio), para esta población. Para asegurarse de que las estadísticas de la muestra sean representativas de toda la población, es mejor tomar una muestra aleatoria. Entonces, siguiendo el ejemplo anterior, el científico necesitaría tomar muestras de 100 nidos de todo el sitio de estudio en lugar de 100 nidos ubicados uno al lado del otro.

Muestra promedio

Una estadística de muestra es la media de la muestra , que está representada por la letra x con una barra sobre ella (pronunciada “x barra”). La media muestral es representativa de la media poblacional , representada por la letra griega μ (mu). La ecuación para la media de la muestra se encuentra a continuación.

{eq} \ bar {x} = \ frac {X_ {1} + X_ {2} + … + X_ {n}} {n} {/ eq}

En esta ecuación, la barra x representa la media de la muestra, X 1 y X 2 representan la primera y la segunda medición, X n representa la enésima medición y n representa el número total de mediciones.

Cómo encontrar la media de la muestra

La media de una muestra se calcula sumando todas las mediciones de la muestra y dividiendo esto por el número total de mediciones. Esto está representado por la ecuación anterior. A continuación se muestra un ejemplo que detalla cómo encontrar la media de la muestra.

Un científico está estudiando una población de 50 cangrejos.

Un cangrejo sentado sobre una roca

una imagen de un cangrejo

Una variable que están midiendo es el peso. El científico ha decidido pesar una muestra aleatoria de 10 cangrejos para representar esta población. Los pesos de estos diez cangrejos, en onzas, son 10, 15, 7, 9, 8, 13, 16, 5, 14 y 6. El científico quiere saber la media de estos pesos.

La ecuación media muestral completa se muestra a continuación.

{eq} \ bar {x} = \ frac {10 + 15 + 7 + 9 + 8 + 13 + 16 + 5 + 14 + 6} {10} {/ eq}

El primer paso para encontrar la media muestral es sumar todos los pesos.

{eq} \ bar {x} = \ frac {103} {10} {/ eq}

El último paso es dividir la suma de los pesos por el número total de medidas, que en este caso es 10.

{eq} \ bar {x} = 10,3 {/ eq}

El peso promedio de los cangrejos en esta muestra es de 10,3 oz. Dado que el científico tomó una muestra aleatoria, esta media también debe ser representativa del peso promedio de la población.

¿Qué es una variación?

Si bien la media puede ser una información útil, a menudo no describe muy bien la naturaleza de los datos. Por ejemplo, la media de 1, 2, 3, 4 y 5 es 3. Sin embargo, la media de 1, 1, 1, 2 y 10 también es 3. Si bien la media de estos dos conjuntos de datos es la misma, está claro que los números del segundo conjunto están más dispersos que los del primer conjunto. Una forma de medir la dispersión de los datos dentro de un conjunto es calcular la varianza .

La varianza es una estadística que describe la dispersión de los datos. Otra estadística de este tipo es la desviación estándar . La desviación estándar describe qué tan lejos están los números en un conjunto de datos de la media. Para calcular la desviación estándar, toma la raíz cuadrada de la varianza . Si bien encontrar la desviación estándar puede ser útil, esta lección se centrará en calcular la varianza.

Varianza de la muestra

La varianza también se puede calcular como una estadística de muestra . La varianza de la población, representada por el símbolo σ 2 (sigma al cuadrado), a menudo no se puede calcular. Cuando no es posible obtener datos de toda la población, tomar una muestra aleatoria de la población puede proporcionar la varianza de la muestra, representada por s 2 . La varianza de la muestra describe la dispersión de los datos en una muestra. La desviación estándar es la raíz cuadrada de la población de varianza y las desviaciones estándar de la muestra están representadas por σ y s, respectivamente.

La fórmula para la varianza de la muestra se muestra a continuación.

{eq} s ^ {2} = \ frac {(x_ {1} – \ bar {x}) ^ {2} + (x_ {2} – \ bar {x}) ^ {2} + … + (x_ {n} – \ bar {x}) ^ {2}} {n-1} {/ eq}

En esta ecuación, s 2 representa la varianza de la muestra , x 1 y x 2 representan la primera y la segunda medición, x n representa la enésima medición, x bar representa la media de la muestra y n representa el número total de mediciones.

Cómo calcular la varianza de la muestra

Antes de calcular la varianza muestral , es necesario calcular la media muestral . Como se muestra en la ecuación anterior, la media de la muestra se resta de cada punto de datos y la diferencia se eleva al cuadrado. El cuadrado de cada diferencia de la media se suma y se divide por el número total de puntos de datos menos uno.

Recuerde el ejemplo anterior. Un científico tomó una muestra de 10 cangrejos con pesos, en onzas, de 10, 15, 7, 9, 8, 13, 16, 5, 14 y 6. El peso medio de esta muestra fue de 10,3 oz. El científico ahora está interesado en calcular la varianza de esta muestra.

Al calcular la varianza de la muestra, puede resultar útil utilizar una tabla como la que se muestra a continuación.

Xsignificarx-mean(x-mean) cuadrado
1010,3-0,30,09
1510,34,722.09
710,3-3,310,89
910,3-1,31,69
810,3-2,35.29
1310,32,77.29
dieciséis10,35.732,49
510,3-5,328.09
1410,33,713,69
610,3-4,318.49
Suma140,1
n-19
Diferencia15,57

En esta tabla, la media se restó de cada medición y la diferencia se elevó al cuadrado. Cada uno de estos valores se sumó y dividió por el número total de mediciones menos uno. La siguiente es una explicación paso a paso utilizando la ecuación de varianza proporcionada anteriormente.

{eq} s ^ {2} = \ frac {(10-10,3) ^ {2} + (15-10,3) ^ {2} + (7-10,3) ^ {2} + (9-10,3) ^ {2 } + (8-10,3) ^ {2} + (13-10,3) ^ {2} + (16-10,3) ^ {2} + (5-10,3) ^ {2} + (14-10,3) ^ {2 } + (6-10,3) ^ {2}} {10-1} {/ eq}

El primer paso es restar la media de cada medición por separado.

{eq} s ^ {2} = \ frac {(- 0.3) ^ {2} + (4.7) ^ {2} + (- 3.3) ^ {2} + (- 1.3) ^ {2} + (- 2.3) ) ^ {2} + (2.7) ^ {2} + (5.7) ^ {2} + (- 5.3) ^ {2} + (3.7) ^ {2} + (- 4.3) ^ {2}} {10 -1} {/ eq}

Luego, cuadre cada diferencia.

{eq} s ^ {2} = \ frac {0.09 + 22.09 + 10.89 + 1.69 + 5.29 + 7.29 + 32.49 + 28.09 + 13.69 + 18.49} {10-1} {/ eq}

Sume todos los términos del numerador y reste los términos del denominador.

{eq} s ^ {2} = \ frac {140.1} {9} {/ eq}

Finalmente, divide el numerador por el denominador.

{eq} s ^ {2} = 15,57 {/ eq}

Varianza de la media muestral

En el ejemplo, se demostró que el peso medio de los cangrejos en la muestra del científico era de 10,3 onzas y se encontró que la varianza era de 15,57. La media proporciona un peso promedio de cangrejos en esta muestra y la varianza describe cuán dispersos están los datos en la muestra. Dado que el científico usó una muestra aleatoria , tanto la media de la muestra como la varianza de la muestra podrían usarse para representar la media de la población y la varianza de la población. Además, la desviación estándar de la muestra se puede encontrar tomando la raíz cuadrada de la varianza.

Resumen de la lección

Las estadísticas de muestra se utilizan a menudo para representar valores para poblaciones enteras, ya que generalmente no es eficiente o rentable tomar datos de poblaciones enteras. Sin embargo, para asegurarse de que las estadísticas de la muestra sean representativas de toda la población, es necesario tomar muestras aleatorias .

La media muestral proporciona el promedio de la muestra. La ecuación para la media de la muestra se encuentra a continuación.

{eq} \ bar {x} = \ frac {X_ {1} + X_ {2} + … + X_ {n}} {n} {/ eq}

Para encontrar la media de la muestra, sume todas las medidas de la muestra y divida por el número total de medidas.

La varianza de la muestra es una estadística de muestra que describe cuán dispersos están los datos. Es necesario calcular la media muestral antes de la varianza, ya que se usa dentro de esa ecuación, que se muestra a continuación.

{eq} s ^ {2} = \ frac {(x_ {1} – \ bar {x}) ^ {2} + (x_ {2} – \ bar {x}) ^ {2} + … + (x_ {n} – \ bar {x}) ^ {2}} {n-1} {/ eq}

Además, la desviación estándar se puede calcular tomando la raíz cuadrada de la varianza.

5/5 - (5 votes)