Proporción muestral en estadística: definición y fórmula

Rodrigo Ricardo Publicado el 22 noviembre, 2020 5 minutos y 18 segundos de lectura

Proporciones de muestra y población

El Sr. Smith es un trabajador electoral en la campaña de Bill Jones. Quiere predecir el porcentaje de ciudadanos del estado que votarán por el Sr. Jones. Pero hay millones de votantes en el estado y no puede sondear a todos los votantes. Entonces, debe estimar la proporción de la población tomando una muestra (encuesta).

La proporción es la forma decimal de un porcentaje, por lo que 100% sería una proporción de 1.000; 50% sería una proporción de 0.500, etc. La proporción de la población que vota por el Sr. Jones está simbolizada por el símbolo p . La proporción tiene la siguiente fórmula:

p = (número de resultados favorables) / (número de resultados en la población)

Si hablamos de la proporción de una muestra en lugar de una población, entonces usaríamos esta fórmula ligeramente modificada:

fórmula de proporción de muestra

En esta segunda fórmula, el símbolo de la izquierda se llama p-hat y se usa para referirse a la proporción de una muestra de la población en contraposición a la proporción de la población total. Si bien las fórmulas se ven muy similares, la diferencia es muy importante. En muchas situaciones, realizar encuestas o muestrear a toda la población es difícil, demasiado caro o imposible.

También tenga en cuenta que en las estadísticas, la palabra «favorable» simplemente se refiere a los resultados que estamos estudiando y no siempre es lo que consideraríamos un resultado «bueno».

Ejemplo

El Sr. Smith encuesta a una muestra de n = 1,000 votantes probables en el estado. 520 de los encuestados dicen que tienen la intención de votar por el Sr. Jones. Esto significa que tenemos 520 resultados favorables de los 1,000 encuestados y 520/1000 = .520.

Dado que esta es solo una estimación de la proporción real que vota por Jones, es probable que sea diferente de p . En estadística, llamamos a este error de muestreo . Error en este caso no significa un error. Se refiere a una diferencia entre la muestra y la población que resulta de no tener acceso a toda la población.

Para explorar más el muestreo, tomemos una situación hipotética en la que en realidad el 54% de la población votará por el alcalde Jones, por lo que p = 0.540. Podríamos simular nuestro proceso de muestreo encuestando a 1,000 votantes, midiendo la proporción de votos a favor y luego repitiendo ese proceso 100 veces, cada vez con una nueva muestra de 1,000 votantes. Enumeramos los primeros 10 resultados:

Muestra # Proporción de 1,000
votantes por Jones
Porcentaje de 1,000
votando por Jones
1.51851,8%
2.51951,9%
3.54154,1%
4.55755,7%
5.56156,1%
6.53553,5%
7.53353,3%
8.55855,8%
9.55155,1%
10.54254,2%

Aquí se puede ver un gráfico de histograma de las 100 muestras de 1000 votantes:

Proportion_Histogram

El eje horizontal muestra la proporción de la muestra; el eje vertical muestra el número de veces que ocurrió esa proporción de muestra. Cada una de nuestras 100 muestras resultó en que entre el 51% y el 57% votaran por Jones y, como era de esperar, el gráfico se centra en el 54%, ya que esa es la proporción de la población.

¿Es la muestra representativa de la población?

Como puede ver, la variación es muy pequeña aunque solo muestreamos a 1,000 votantes. Por sorprendente que parezca, si desea poder estimar la proporción dentro de más o menos 0.03, o 3%, solo necesita una muestra de aproximadamente 1.100, independientemente del tamaño de la población.

Sin embargo, un aspecto importante a tener en cuenta es la importancia de tener una muestra representativa de la población. Suponga que quiere saber qué porcentaje de la población de EE. UU. Cree que hombres y mujeres reciben el mismo salario. Debe asegurarse de muestrear una cantidad igual de cada género en su muestra, o puede terminar con un porcentaje engañosamente alto o bajo.

Cómo determinar el tamaño de muestra necesario

Tenga en cuenta que si la proporción de su muestra se va a utilizar de manera confiable para determinar la proporción de la población, entonces el producto del tamaño de la muestra y el menor de p-hat y 1 p-hat debe ser al menos 5.

Otra cosa importante es determinar qué tamaño de muestra necesita. Podemos usar esta fórmula:

n fórmula

Por supuesto, no sabemos cuál es la proporción de nuestra muestra, ya que aún no hemos tomado una muestra, y aún no hemos tomado una muestra porque no sabemos cuál es el tamaño de nuestra muestra, una especie de Catch-22 ! Así que asumimos una proporción muestral de 0.500. Si la proporción real es diferente, la n que obtengamos será una sobreestimación en todo caso. Entonces, un p-hat de 0.500 es una buena suposición conservadora.

Por cierto, ¿qué pasa si n es una fracción? (que probablemente será)? En ese caso, siempre redondeamos. Si nuestra fórmula nos da n = 10.001, necesitaríamos muestrear 11. Para redondear hacia abajo a 10, obtendríamos un error mayor que el que estamos buscando.

Resumen de la lección

La proporción es la forma decimal del porcentaje de una población o muestra que cumple ciertos criterios. Dado que a menudo no tenemos el acceso o los recursos para sondear o muestrear una población completa, usamos la proporción de la muestra para estimar la proporción de la población. Es importante tener en cuenta el error de muestreo , que es la diferencia entre la muestra y la población que resulta de no tener acceso a toda la población. De manera óptima, queremos que el producto del tamaño de la muestra y el menor de p-hat o 1 – p-hat sea ​​al menos 5.

Aunque estimar el tamaño de la muestra necesario para sondear es un tema complicado, una regla básica es usar la fórmula 1 / E 2 , donde E es el margen de error expresado como decimal. Tan importante como tener un buen tamaño de muestra es asegurarse de tener una muestra no sesgada, en otras palabras, que nuestra muestra sea representativa de la población.

Los resultados del aprendizaje

Después de completar esta lección, los estudiantes deberían poder:

  • Definir proporción
  • Describe cómo calcular una proporción de muestra.
  • Identificar el significado del error de muestreo

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador