Hallar probabilidades sobre las medias usando el teorema del límite central

Rodrigo Ricardo Publicado el 23 noviembre, 2020 4 minutos y 15 segundos de lectura

Encuestas y probabilidad

¿Se ha preguntado alguna vez cómo las encuestas de opinión pública pueden proporcionar una predicción precisa de un evento futuro, como el resultado de una elección presidencial? Después de todo, el número de personas muestreadas es mucho menor que el tamaño de la población. De hecho, este enfoque de tomar muestras de un gran conjunto de datos para predecir algo al respecto se realiza en muchos campos diferentes, incluidas las ciencias físicas, la medicina y las finanzas. En esta lección, aprenderá a usar el Teorema del límite central para encontrar probabilidades sobre las medias.

El teorema del límite central

El teorema del límite central establece que si tomamos suficientes muestras aleatorias independientes de tamaño ‘n’ donde ‘n’ es suficientemente grande, entonces la distribución de las medias de las muestras se acercará a la distribución normal. Esto es válido incluso para los conjuntos de datos que no se distribuyen normalmente para empezar, como veremos a continuación. En la distribución normal , la mayoría de los valores de un conjunto de datos se agrupan alrededor de la mitad del rango, y el resto se reduce gradualmente hacia un extremo u otro, dando a la curva de distribución de frecuencia una forma de campana simétrica.

Explicación del teorema del límite central

Examinemos lo que significa el teorema del límite central con un ejemplo simple. Suponga que un biólogo quiere determinar la distribución de peso de las ardillas en un bosque. Una forma de hacerlo sería encontrar y pesar cada ardilla. Desafortunadamente, eso sería demasiado caro y poco práctico. Entonces, el biólogo encuentra una mejor solución, confiando en el Teorema del Límite Central. Comienza pesando grupos de tres ardillas a la vez, seleccionadas al azar de la población. Después de encontrar las tasas medias de estos grupos de tres, traza los resultados. La distribución de los medios no parece tener una forma reconocible. Luego procede a pesar grupos de diez ardillas a la vez, nuevamente elegidas al azar de toda la población. El histograma ahora se parece más a una distribución normal. Sin embargo, el biólogo decide probar con un tamaño de muestra aún mayor. Ahora sale y pesa grupos de 100 ardillas a la vez. Ahora, la distribución de pesos medios parece muy similar a una distribución normal.

Los resultados del biólogo están de acuerdo con el teorema del límite central. A medida que se incrementó el tamaño de la muestra, la distribución de las medias se acercó cada vez más a una distribución normal. ¿Qué pasa si la distribución es inherentemente bimodal, como la distribución del peso de las hormigas en una colonia donde solo hay dos tipos de hormigas? Los hay grandes y muy pequeños, como se muestra en la pantalla. Si el biólogo estudiara estas hormigas, la distribución de las medias de sus pesos, asumiendo un tamaño de muestra suficientemente grande, seguiría siendo normal. Como antes, aumentar el tamaño de la muestra haría que la distribución se convierta en una mejor aproximación de la distribución normal.

Implicaciones del teorema del límite central

¿Por qué es importante el teorema del límite central? Resulta que cuando el tamaño de la muestra es lo suficientemente grande, se mantendrán las siguientes propiedades:

1. La media de la población se puede aproximar mediante la media de las medias muestrales.

2. La desviación estándar de la muestra será aproximadamente igual a la desviación estándar de la población dividida por la raíz cuadrada del tamaño de la muestra.

Como puede ver, estas propiedades brindan a los investigadores la capacidad de encontrar información sobre una población completa al muestrearla de la manera correcta.

Resumen de la lección

¿Y por qué no probamos nuestra lección con un resumen rápido? En esta lección, ha aprendido sobre el teorema del límite central y sus implicaciones. Este teorema establece que si tomamos suficientes muestras aleatorias independientes de tamaño ‘n’, donde ‘n’ es suficientemente grande, entonces la distribución de las medias de las muestras se acercará a la distribución normal . En otras palabras, si tomamos muestras aleatorias suficientemente grandes de una población, calculando posteriormente las medias de estas muestras, estas medias seguirán una distribución normal. Esto seguirá siendo cierto, incluso si la población no está distribuida normalmente para empezar. Asimismo, recordemos que existen implicaciones muy importantes de este teorema, principalmente, las siguientes:

1. La media de la población se puede aproximar mediante la media de las medias muestrales.

2. La desviación estándar de la muestra será aproximadamente igual a la desviación estándar de la población dividida por la raíz cuadrada del tamaño de la muestra.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador