Cómo calcular el error estándar: Ecuación y ejemplo

Publicado el 30 abril, 2024 por Rodrigo Ricardo

Error estándar

El error estándar (SE) de estimación es una estadística de la estabilidad y confiabilidad de los datos y es similar a la desviación estándar (SD). El error estándar se utiliza para estimar la desviación estándarde la distribución muestral. Si el error estándar es alto, el conjunto de datos se considera inestable, lo que significa que la adición de nuevas observaciones tendrá un mayor efecto en la media de la muestra. Además, un pequeño error estándar indica que el conjunto de datos es confiable. Es muy importante comprender la diferencia entre el error estándar y la desviación estándar porque uno es una estadística y el otro es un parámetro. El error estándar es una estadística que se calcula para la distribución de muestreo, mientras que la desviación estándar es un parámetro y se estima para la población. Una forma importante en que el error estándar difiere de la desviación estándar es que el error estándar se calcula utilizando la desviación estándar y se calcula para las distribuciones de muestreo y no para la muestra.

¿Cómo calcular el error estándar de estimación?

Una distribución de muestreo es un conjunto de estadísticas (p. ej., la media, la mediana, etc.) obtenidas al muestrear la población repetidamente. El error estándar (SE) para la distribución de muestreo se puede calcular para la distribución de muestreo de medias, diferencia de dos medias, proporciones y diferencia de dos proporciones. Las fórmulas para calcular el error estándar junto con ejemplos se proporcionan a continuación.

Fórmula de error estándar: media

El error estándar de la media se puede calcular a partir de una distribución muestral de medias. Esto significa que se tomaron múltiples muestras de la población y las medias de cada muestra ahora se consideran un conjunto de datos de medias. Debido a que el conjunto de datos contiene una distribución de muestreo, la medida de dispersión calculada sería el error estándar. La fórmula para calcular el error estándar de la media es $$\sigma_{\bar{x}}= \frac{s_x}{\sqrt{n}} $$ donde $$\sigma_{\bar{x}} $$ es el error estándar de la media, $$s_x $$ es la desviación estándar estimada de la distribución muestral y $${\sqrt{n}} $$ es la raíz cuadrada del número de medias muestrales en la distribución muestral.

Ejemplo

Una investigadora está interesada en determinar qué tan rápido viajan los autos en la calle donde está ubicada su casa. No puede medir la velocidad de cada automóvil, por lo que decide medir la velocidad de 10 automóviles al azar que pasan frente a su casa durante una semana. A continuación se muestran los datos de la velocidad media de los 10 automóviles cada día de la semana en millas por hora.

Figura 1: Imagen de datos de velocidad diaria promedio recopilados por el investigador A

Los datos de la Figura 1 representan una distribución muestral de la media. El investigador realiza los siguientes cálculos para calcular el error estándar de la media:

1) Calcular la media de las medias y la desviación estándar de las medias.

La media de las medias es 25 y la desviación estándar de las medias es $$s_x = 1.63 $$

2) El error estándar de las medias en millas por hora es

$$\sigma_{\bar{x}}= \frac{s_x}{\sqrt{n}} = \frac{1.63}{\sqrt{7}} = 0.62 $$

Fórmula de error estándar: la diferencia de medias

A veces, los investigadores necesitan comparar dos medias calculadas a partir de dos distribuciones de muestreo diferentes para determinar si esas distribuciones de muestreo son similares o no. La comparación de dos medias es muy común en la investigación experimental porque permite a los investigadores determinar los resultados de las condiciones del tratamiento. La comparación de medias también se utiliza para determinar la relación causal al examinar si existe una diferencia significativa entre los datos no experimentales, como los puntajes de las pruebas de diferentes aulas. La siguiente fórmula se puede utilizar para calcular el error estándar de la diferencia de dos medias:

$$\sigma_{(\bar{x_1}-\bar{x_2})}= \sqrt{\frac{s_1^2}{n_1}+\frac{s_1^2}{n_1}} $$

Ejemplo

La investigadora comparte sus datos con un colega que vive en una calle más allá de ella. Decide repetir el experimento y registrar los datos de velocidad de manera similar al primer investigador generando otra distribución de muestreo. Ambos investigadores están interesados ​​en comparar los dos medios para determinar si los hábitos de conducción son los mismos para los conductores en ambas calles o si son diferentes. Y si son diferentes, ¿qué tan grande es esa diferencia? Los datos de ambos investigadores se pueden ver a continuación.

Figura 2: Imagen de datos de velocidad diaria promedio recopilados por el investigador B

El segundo investigador determina que la media de su distribución muestral es 24,43 millas por hora y la desviación estándar es $$s_x = 1,72 $$

Usando toda la información sobre las dos distribuciones de muestreo, el error estándar para la diferencia de medias es:

El error estándar de las medias es .75 millas por hora.

$$\sigma_{(\bar{x_1}-\bar{x_2})}= \sqrt{\frac{s_1^2}{n_1}+\frac{s_1^2}{n_1}} = \sqrt{\ fracción{(1,63)^2}{10}+\frac{(1,72)^2}{10}} = $$

$$\sqrt{\frac{2.66}{10}+\frac{2.96}{10}} = \sqrt{.27 + .3} = .75$$

Fórmula de error estándar: proporción

A menudo, los investigadores necesitan responder preguntas sobre la proporción de una población. Por ejemplo, qué proporción de países bordean un cuerpo de agua, qué proporción de hombres fuman, o qué proporción de profesoras tienen puestos permanentes, etc. El error estándar de una proporción se puede calcular usando la siguiente fórmula:

$$SE(\hat{p})=\sqrt{\frac{p(1-p)}{n}} $$

Donde p = la proporción de interés (éxito), 1-p = la proporción de desinterés (fracaso) y n = número de observaciones.

Ejemplo

Por ejemplo, la investigadora de nuestro ejemplo anterior puede estar interesada en explorar cuántos de sus amigos en las redes sociales todavía leen un periódico físico (copia en papel) y cómo pueden simplemente obtener sus noticias de fuentes en línea (periódicos digitales). Decide plantear esta pregunta a todos sus amigos de las redes sociales en 5 grupos de los que es miembro. Los siguientes son los datos que recopila sobre los hábitos de lectura de periódicos de sus amigos de las redes sociales.

Figura 3: Imagen de datos para proporción de investigadores Como amigos que leen diario físico o digital

La investigadora está interesada en la proporción de sus amigos que obtienen sus noticias de un periódico físico. La proporción de amigos que reciben sus noticias de un periódico físico (p) = .64 y la proporción de sus amigos que reciben sus noticias de medios digitales es (1-p) = .36. Entonces el error estándar es

$$SE(\hat{p})=\sqrt{\frac{.64(.36)}{435}} = 0.02 $$

Fórmula de error estándar: la diferencia de proporciones

Los investigadores suelen utilizar el diseño experimental para recopilar datos sobre la eficacia de un determinado tratamiento. Por ejemplo, la eficacia de una vacuna o una herramienta tecnológica en el aula. Cuando se comparan dos proporciones, es necesario calcular el error estándar de la diferencia de las dos proporciones. El error estándar de la diferencia de dos proporciones se puede calcular usando la siguiente fórmula:

Imagen de la fórmula para calcular el error estándar de la diferencia de dos proporciones

Donde {eq}p_1 {/eq}= la primera proporción de interés (éxito),

{eq}q_1 {/eq}= la primera proporción de desinterés (fracaso),

{eq}p_2 {/eq}= la segunda proporción de interés (éxito),

{eq}q_2 {/eq}= la segunda proporción de desinterés (fracaso),

{eq}n_1 {/eq}= el primer tamaño de muestra, y

{eq}n_2 {/eq}= el segundo tamaño de muestra.

Ejemplo

La investigadora A concluyó que el error estándar de su proporción de amigos que prefieren un periódico físico es 0,02 (tomado del ejemplo anterior). Su amigo, el investigador B, también estaba interesado en averiguar qué proporción de sus amigos prefiere un periódico físico, por lo que realiza la misma encuesta con sus amigos de las redes sociales. A continuación se muestran los datos combinados de ambos investigadores.

Imagen de una persona leyendo un periódico físico
Imagen de una persona leyendo un periódico digital
Figura 4: Imagen de datos para investigador Bs proporción de amigos que leen diarios físicos o digitales

Ambos investigadores estaban interesados ​​en comparar la proporción de sus amigos que preferían un periódico físico por lo que calcularon el error estándar de la diferencia de proporciones mediante la siguiente fórmula:

Imagen de la fórmula para calcular el error estándar de la diferencia de dos proporciones

Interpretación del error estándar

El error estándar es una estadística similar a la desviación estándar. Y al igual que la desviación estándar, esta estadística se utiliza para transmitir la dispersión de datos sobre la media. El error estándar se utiliza para calcular el intervalo de confianza en torno al valor medio observado y para realizar pruebas de hipótesis. En esto, el error estándar nos permite usar datos históricos sobre cualquier fenómeno dado y predecir las condiciones futuras relacionadas con ese fenómeno con cierto grado de confianza. Los intervalos de confianza son una parte integral del análisis estadístico y se utilizan para predecir el comportamiento y para la toma de decisiones en una serie de industrias todos los días.

Un ejemplo interesante del uso del error estándar en el mundo de las finanzas es cuando un banco está tratando de determinar una tasa de interés adecuada, por lo general observa el historial de incumplimiento y reembolso de los clientes y trata de predecir con cierta confianza cómo se comportarán los clientes en el futuro. Por ejemplo, utilizando datos anteriores, el equipo de evaluación de riesgos de un banco determina que alrededor del 6 % de las personas no pagan sus préstamos (no los devuelven). El banco se está preparando para otorgar préstamos a 1.000 nuevos prestatarios. Les gustaría saber cuál es la probabilidad de que el 15% de los nuevos préstamos sean morosos. Para responder a esta pregunta, el equipo de evaluación del banco primero debe calcular el error estándar utilizando la siguiente fórmula:

$$SE(\hat{p})=\sqrt{\frac{p(1-p)}{n}} $$

Donde p = la proporción de buenos préstamos (éxito), 1-p = la proporción de préstamos en mora (fracaso), y n = número de observaciones.

$$SE(\hat{p})=\sqrt{\frac{.06(1-.06)}{1000}} = .0017 $$

El límite inferior del intervalo de confianza del 95 % es: {eq}.06 – 2(.0017) = .0583 {/eq}

El límite superior del intervalo de confianza del 95 % es: {eq}.06 + 2(.0017) =.0617 {/eq}

Esto significa que existe una probabilidad del 95% de que, en promedio, entre el 5,8% y el 6,17% de los préstamos resulten en incumplimiento. Mucho menos que el umbral del 15% establecido por el equipo de evaluación de riesgos del banco.

Resumen de la lección

El error estándar (SE) se utiliza para determinar la confiabilidad y estabilidad de los datos. El error estándar proporciona una estimación de qué tan cerca está la media de la muestra de la media de la población. El error estándar se calcula dividiendo la desviación estándar de la población por la raíz cuadrada del número de elementos de la población. Es importante recordar que población se refiere a aquellos miembros a quienes se aplica la pregunta de investigación. Por ejemplo, si la pregunta de investigación se refiere a los estudiantes de la clase A, entonces la población de interés es solo el número de estudiantes de la clase A. El uso más importante del error estándar es generar intervalos de confianza. El límite inferior de un intervalo de confianza del 95 % en torno a la media de una distribución de muestreo se puede generar multiplicando el error estándar por 1,96 y luego restando ese producto de la media.

Articulos relacionados