Uso de la distribución t para encontrar intervalos de confianza

Rodrigo Ricardo Publicado el 23 noviembre, 2020 5 minutos y 28 segundos de lectura

Desviación estándar de la muestra

Lo más probable es que no tengamos el privilegio de conocer la desviación estándar de toda la población, que se denota con el símbolo sigma . La desviación estándar es la variabilidad de las observaciones individuales alrededor de su media. Por lo tanto, casi siempre usamos la desviación estándar de la muestra, denotada por el símbolo s , para calcular el intervalo de confianza para una media poblacional ( mu ).

Veamos cómo hacemos esto con un ejemplo.

Escenarios de casos

Antes de trabajar en el ejemplo, debemos considerar el hecho de que hay tres posibles escenarios de casos que podríamos encontrar en los que necesitamos construir un intervalo de confianza. Son los siguientes:

Caso I:

  • No se conoce la desviación estándar de la población.
  • El tamaño de la muestra es pequeño, lo que significa que n (el tamaño de la muestra) es menor que 30
  • La población se distribuye normalmente

Caso II:

  • No se conoce la desviación estándar de la población.
  • El tamaño de la muestra es grande; en otras palabras, n es mayor o igual que 30

Caso III:

  • No se conoce la desviación estándar de la población.
  • El tamaño de la muestra es pequeño; ergo n <30
  • La población no está distribuida normalmente o no conocemos su distribución

En el caso III, necesitaríamos utilizar métodos no paramétricos para calcular el intervalo de confianza para la media poblacional, mu . En los casos I y II, usaríamos la distribución t para construir el intervalo de confianza para mu . Son estos dos casos los que serán el foco de esta lección.

La distribución T

La distribución t , también conocida como la distribución t de Student, es una especie de curva de distribución simétrica en forma de campana que tiene una altura menor pero una extensión más amplia que la curva de distribución normal estándar. Básicamente, podemos decir que debido a que la distribución t es más plana que la curva de distribución normal estándar, tiene una desviación estándar mayor. Por cierto, en caso de que se lo pregunte, el nombre proviene de Student, un seudónimo utilizado por WS Gosset, el hombre que desarrolló la distribución t .

De todos modos, la forma real de una curva de distribución t realmente depende de algo conocido como grados de libertad ( gl ) , que se calculan como n – 1, donde n es nuestro tamaño de muestra. A medida que el tamaño de la muestra en cuestión se vuelve cada vez más grande, la distribución t en realidad se acercará a la distribución normal estándar.

Hay varias cosas que debe saber sobre la distribución t :

  • El área total bajo su curva es 1.0 (o 100%)
  • La curva nunca toca el eje horizontal
  • La media de la distribución t es 0
  • La desviación estándar es igual a la raíz cuadrada de df / ( df – 2)

Calcular intervalos de confianza

Cuando no conocemos el valor de sigma , la desviación estándar de la población, usamos la desviación estándar de la muestra en su lugar. Esto significa que usamos la siguiente ecuación para encontrar la desviación estándar de x-bar (la media de la muestra):

s x-bar = s / √ n

El intervalo de confianza para mu se encuentra usando:

barra x +/- t * s barra x

El valor de t se encuentra a partir de una tabla de distribución t utilizando n – 1 grados de libertad y el nivel de confianza apropiado en esta tabla.

t * s x-bar es realmente algo que se conoce como el margen de error, y la etiqueta es de otra manera como E . Sentido:

E = t * s x-bar = margen de error

Ejemplo

Trabajemos juntos en un ejemplo.

Una empresa de salud desea calcular el peso medio de todos los adultos que viven en la ciudad de Nueva York. Toman una muestra de 25 adultos de la ciudad de Nueva York y encuentran que el peso medio es de 165 libras con una desviación estándar de 10 libras. Suponga que los pesos de todos los adultos en la ciudad de Nueva York se distribuyen normalmente. Con esta información, construya un intervalo de confianza del 95% para la media de la población.

Primero, escribamos lo que sabemos:

  • El tamaño de la muestra, n , es igual a 25
  • La media muestral, barra x , es 165
  • La desviación estándar de la muestra, s , es 10
  • El nivel de confianza es del 95% o 0,95

Sabiendo esto, es una cuestión de enchufar y profundizar en nuestras ecuaciones anteriores.

¿Qué es s x-bar ? Es igual a s / √ n . En otras palabras, es igual a

s barra x = 10 / √ 25 = 10/5 = 2

¿Cuáles son nuestros grados de libertad?

gl = n – 1 = 25 – 1 = 24

Reste el valor de confianza de 0,95 de 1 para obtener 0,05. Divida este número por 2 para obtener 0.025. Dividimos por 2 porque nos preocupa el área debajo de ambas colas de la curva. Usando esta tabla, el gl y el valor de 0.025, encontraría que el valor de t es igual a 2.064.

A continuación, sustituya todos los valores que conocemos en x-bar +/- t * s x-bar . Esto equivale a 165 + / (- 2.064 * 2) = 165 +/- 4.13 = 160.87 a 169.13 libras. Por tanto, nuestro intervalo de confianza es de 160,87 a 169,13 libras.

Resumen de la lección

Ahora sabe cómo calcular los intervalos de confianza en los casos en los que no conocemos la desviación estándar de la población.

La desviación estándar es la variabilidad de las observaciones individuales alrededor de su media. Podemos usar la desviación estándar de la muestra, denotada por el símbolo s , para calcular el intervalo de confianza para una media poblacional ( mu ). En estos casos, usamos la distribución t , también conocida como distribución t de Student , que es una especie de curva de distribución simétrica en forma de campana que tiene una altura menor pero una extensión más amplia que la curva de distribución normal estándar. La forma real de una curva de distribución t depende de algo conocido como grados de libertad ( gl ) , que se calculan como n-1. Usando las ecuaciones que se encuentran en esta lección, ahora podrá calcular los intervalos de confianza apropiados por su cuenta.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador