Estimación de la varianza: definición y ejemplo

Rodrigo Ricardo Publicado el 23 noviembre, 2020 4 minutos y 43 segundos de lectura

¿Qué mide la varianza?

Una compañía farmacéutica ha desarrollado un nuevo medicamento que se supone que reduce la presión arterial, y un científico investigador de la compañía está llevando a cabo un estudio para medir la eficacia del medicamento. Selecciona dos grupos de pacientes similares. A un grupo se le administra el nuevo medicamento, mientras que al otro se le administra un placebo. La presión arterial de ambos grupos se controla y registra periódicamente. ¿Cómo decidirá el científico si el fármaco es eficaz o no? Tomar decisiones como esta requiere estadísticas.

Existen pruebas estadísticas, como la prueba t de Student, que se utilizan para decidir si dos conjuntos de datos son realmente diferentes entre sí o no. Pero antes de que el científico pueda realizar una prueba t para ver si el fármaco está produciendo una diferencia estadísticamente significativa en la presión arterial, primero tendría que calcular la varianza de cada conjunto de datos.

La varianza mide qué tan dispersos están los datos en una muestra. Dos conjuntos de datos con la misma media podrían distribuirse de manera muy diferente y la varianza es una forma de cuantificar esta diferencia. Si la varianza es pequeña, esto significa que todas las medidas están cerca de la media y no hay mucha variabilidad. Si la varianza es grande, los datos están muy dispersos y son muy variables.

Cómo calcular la varianza

Para calcular la varianza en un conjunto de datos, debe tener en cuenta qué tan lejos está cada medición de la media y el número total de mediciones realizadas.

1. Primero, tome todos sus datos y encuentre la media. Puede hacer esto sumando todas las medidas y luego dividiendo por el número total de medidas.

2. Luego, reste cada medida de la media y luego eleve al cuadrado estos valores.

3. Finalmente, sume todos los valores que acaba de calcular en (2) y luego divida por el número total de mediciones. ¡Esta es la varianza de la muestra!

Varianza: ejemplo de cálculo

Veamos los datos que el científico farmacéutico recopiló de pacientes que estaban tomando el nuevo medicamento para la presión arterial.

tabla de datos de presión arterial

La presión arterial media de los sujetos con y sin el fármaco parece diferente, pero sin conocer la varianza de los dos grupos, es imposible determinar si en realidad son estadísticamente diferentes o no. Es posible que la varianza de ambos sea lo suficientemente grande como para que haya una cantidad significativa de superposición entre los dos conjuntos de datos. En ese caso, es posible que las medias NO sean estadísticamente diferentes.

Para determinar si estos grupos son realmente diferentes, primero observemos el grupo que recibió el medicamento y calculemos la variación en las mediciones de la presión arterial.

Primero, calcule la media y luego reste cada medida de la media. Será útil poner estos valores en una tabla como la que se muestra a continuación. Para encontrar la varianza, eleve al cuadrado todos esos valores, súmelos y divida por el número total de medidas.

cálculo de varianza

Pruebas de varianza y T

Ahora que se conoce la varianza del conjunto de datos, ¿cómo lo usaría el científico para determinar si el medicamento es efectivo o no? Se puede realizar una prueba t de Student para responder a esta pregunta, pero solo es válida si las varianzas de ambos grupos son similares. ¿Es esa una suposición válida en este caso? Necesitamos calcular la varianza del grupo de control para averiguarlo.

varianza del grupo de control

En este caso, las varianzas son muy similares, por lo que está bien usar la prueba t de Student para determinar si los grupos son realmente diferentes. Si las varianzas hubieran sido diferentes, se debería utilizar otro tipo de prueba t, llamada prueba t de Welch.

No entraremos en todos los detalles de cómo realizar la prueba t aquí (aunque hay otras lecciones sobre eso que puede consultar). En un nivel básico, la prueba t calcula un estadístico t que depende tanto de la diferencia entre las medias como de la cantidad de variabilidad en los datos, que está determinada por la varianza. Luego, el estadístico t se puede comparar con una tabla de niveles de significancia para determinar si los grupos realmente son estadísticamente diferentes entre sí.

Si se realizara una prueba t de Student entre los dos grupos en este estudio, el estadístico t calculado sería 0.0785. Si busca este valor en una tabla de estadísticas t, encontrará que las medias NO son significativamente diferentes entre los dos grupos. Entonces, aunque puedan parecer diferentes, la variación en cada grupo es lo suficientemente grande como para que no podamos llegar a esa conclusión. Esto no significa que el nuevo fármaco no funcione, pero este pequeño estudio tampoco proporciona evidencia suficiente para demostrar que sí funciona.

Resumen de la lección

La varianza mide la cantidad de propagación en un conjunto de datos. Es importante en estadística porque determina qué pruebas se pueden usar para determinar si dos conjuntos de datos son significativamente diferentes o no. Si las varianzas de los dos conjuntos de datos son similares, se puede hacer una comparación utilizando la prueba t de Student . Esta prueba calcula un estadístico t que depende tanto de la diferencia entre las medias como de la varianza de los datos. El estadístico t puede usarse para determinar si las medias son significativamente diferentes.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador