Uso de la distribución t para encontrar intervalos de confianza

¿Quieres explorar más? 📂 Explorar Categorías 🔥 Tendencias 🎓 Cursos

Desviación estándar de la muestra

Lo más probable es que no tengamos el privilegio de conocer la desviación estándar de toda la población, que se denota con el símbolo sigma . La desviación estándar es la variabilidad de las observaciones individuales alrededor de su media. Por lo tanto, casi siempre usamos la desviación estándar de la muestra, denotada por el símbolo s , para calcular el intervalo de confianza para una media poblacional ( mu ).

Veamos cómo hacemos esto con un ejemplo.

Escenarios de casos

Antes de trabajar en el ejemplo, debemos considerar el hecho de que hay tres posibles escenarios de casos que podríamos encontrar en los que necesitamos construir un intervalo de confianza. Son los siguientes:

Caso I:

No se conoce la desviación estándar de la población.
El tamaño de la muestra es pequeño, lo que significa que n (el tamaño de la muestra) es menor que 30
La población se distribuye normalmente

Caso II:

No se conoce la desviación estándar de la población.
El tamaño de la muestra es grande; en otras palabras, n es mayor o igual que 30

Caso III:

No se conoce la desviación estándar de la población.
El tamaño de la muestra es pequeño; ergo n <30
La población no está distribuida normalmente o no conocemos su distribución

En el caso III, necesitaríamos utilizar métodos no paramétricos para calcular el intervalo de confianza para la media poblacional, mu . En los casos I y II, usaríamos la distribución t para construir el intervalo de confianza para mu . Son estos dos casos los que serán el foco de esta lección.

La distribución T

La distribución t , también conocida como la distribución t de Student, es una especie de curva de distribución simétrica en forma de campana que tiene una altura menor pero una extensión más amplia que la curva de distribución normal estándar. Básicamente, podemos decir que debido a que la distribución t es más plana que la curva de distribución normal estándar, tiene una desviación estándar mayor. Por cierto, en caso de que se lo pregunte, el nombre proviene de Student, un seudónimo utilizado por WS Gosset, el hombre que desarrolló la distribución t .

Tema relacionado:
¿Qué es la distribución de probabilidad discreta? Ecuaciones y ejemplos

De todos modos, la forma real de una curva de distribución t realmente depende de algo conocido como grados de libertad ( gl ) , que se calculan como n – 1, donde n es nuestro tamaño de muestra. A medida que el tamaño de la muestra en cuestión se vuelve cada vez más grande, la distribución t en realidad se acercará a la distribución normal estándar.

Hay varias cosas que debe saber sobre la distribución t :

El área total bajo su curva es 1.0 (o 100%)
La curva nunca toca el eje horizontal
La media de la distribución t es 0
La desviación estándar es igual a la raíz cuadrada de df / ( df – 2)

Calcular intervalos de confianza

Cuando no conocemos el valor de sigma , la desviación estándar de la población, usamos la desviación estándar de la muestra en su lugar. Esto significa que usamos la siguiente ecuación para encontrar la desviación estándar de x-bar (la media de la muestra):

s x-bar = s / √ n

El intervalo de confianza para mu se encuentra usando:

Tema relacionado:
¿Qué es la Distribución Geográfica? Ejemplos

barra x +/- t * s barra x

El valor de t se encuentra a partir de una tabla de distribución t utilizando n – 1 grados de libertad y el nivel de confianza apropiado en esta tabla.

t * s x-bar es realmente algo que se conoce como el margen de error, y la etiqueta es de otra manera como E . Sentido:

E = t * s x-bar = margen de error

Ejemplo

Trabajemos juntos en un ejemplo.

Tema relacionado:
La distribución de plantas y animales en el Caribe, Centroamérica y Sudamérica

Una empresa de salud desea calcular el peso medio de todos los adultos que viven en la ciudad de Nueva York. Toman una muestra de 25 adultos de la ciudad de Nueva York y encuentran que el peso medio es de 165 libras con una desviación estándar de 10 libras. Suponga que los pesos de todos los adultos en la ciudad de Nueva York se distribuyen normalmente. Con esta información, construya un intervalo de confianza del 95% para la media de la población.

Primero, escribamos lo que sabemos:

El tamaño de la muestra, n , es igual a 25
La media muestral, barra x , es 165
La desviación estándar de la muestra, s , es 10
El nivel de confianza es del 95% o 0,95

Sabiendo esto, es una cuestión de enchufar y profundizar en nuestras ecuaciones anteriores.

¿Qué es s x-bar ? Es igual a s / √ n . En otras palabras, es igual a

s barra x = 10 / √ 25 = 10/5 = 2

¿Cuáles son nuestros grados de libertad?

gl = n – 1 = 25 – 1 = 24

Reste el valor de confianza de 0,95 de 1 para obtener 0,05. Divida este número por 2 para obtener 0.025. Dividimos por 2 porque nos preocupa el área debajo de ambas colas de la curva. Usando esta tabla, el gl y el valor de 0.025, encontraría que el valor de t es igual a 2.064.

A continuación, sustituya todos los valores que conocemos en x-bar +/- t * s x-bar . Esto equivale a 165 + / (- 2.064 * 2) = 165 +/- 4.13 = 160.87 a 169.13 libras. Por tanto, nuestro intervalo de confianza es de 160,87 a 169,13 libras.

Resumen de la lección

Ahora sabe cómo calcular los intervalos de confianza en los casos en los que no conocemos la desviación estándar de la población.

La desviación estándar es la variabilidad de las observaciones individuales alrededor de su media. Podemos usar la desviación estándar de la muestra, denotada por el símbolo s , para calcular el intervalo de confianza para una media poblacional ( mu ). En estos casos, usamos la distribución t , también conocida como distribución t de Student , que es una especie de curva de distribución simétrica en forma de campana que tiene una altura menor pero una extensión más amplia que la curva de distribución normal estándar. La forma real de una curva de distribución t depende de algo conocido como grados de libertad ( gl ) , que se calculan como n-1. Usando las ecuaciones que se encuentran en esta lección, ahora podrá calcular los intervalos de confianza apropiados por su cuenta.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo Editor y fundador