Rodrigo Ricardo

¿Qué son las pruebas t? – Evaluación de las diferencias estadísticas entre grupos

Publicado el 21 septiembre, 2020

Definiciones

A menudo me he preguntado si tener dos clases combinadas es algo bueno. No lo siento. No es una especie de idea antimarxista / marxista, me refiero a las clases escolares. Cuando combinas dos clases tienes que enseñar al nivel más bajo de la sala. Por ejemplo, si tuviste una clase para estudiantes de secundaria en la que combinaste estudiantes de último año y primer año, entonces tienes que enseñarla en el nivel de primer año. Esto aburrirá a las personas mayores porque están muy por encima de ese nivel.

Sin embargo, si enseñó en el nivel superior, confundiría al estudiante de primer año porque no ha tenido tanta experiencia. Los mismos problemas ocurren en la universidad y en la escuela de posgrado, probablemente incluso más. Entonces, la pregunta para quienes diseñan las clases y para quienes están evaluando si combinar o no dos niveles diferentes de estudiantes es: ‘¿Son los niveles de experiencia y conocimiento de las clases tan diferentes que un grupo no obtendrá ningún uso de la clase? ‘

La prueba t es una prueba estadística para determinar si hay una diferencia medida entre dos grupos. La prueba t siempre tiene una letra minúscula ‘t’, que parece haber sido elegida arbitrariamente. La prueba t también puede denominarse prueba t de Student porque William Gossett la imprimió con el seudónimo de “Student” para evitar problemas con un empleador en una cervecería. Si bien no es necesario saber esto para hacer las estadísticas, a veces es interesante recordar que el propósito de las estadísticas es resolver problemas del mundo real. Por ejemplo, ¿es la cerveza A, en promedio, mejor que la cerveza B?

Nulo y Alt

Las pruebas t utilizan tanto una hipótesis nula como una alternativa. Una hipótesis nula suele ser la suposición estándar y se define como la predicción de que no hay interacción entre las variables. A esto se opone la hipótesis alternativa , también conocida como hipótesis de investigación, definida como la predicción de que existe una interacción medida entre las variables.

Debido a que las pruebas t buscan específicamente ver si hay una diferencia entre los dos grupos de puntajes, la hipótesis nula es que no hay diferencia entre los grupos. Entonces, si tenemos una clase combinada de cuarto y quinto grado y si no rechazamos la hipótesis nula, eso significaría que no hay una diferencia significativa entre los estudiantes de cuarto y quinto grado. La prueba t puede rechazar la hipótesis nula, lo que significaría que buscaríamos la hipótesis alternativa. Con la hipótesis alternativa, podríamos decir que existe una diferencia significativa entre los grupos.

Estadísticas de la prueba t

Ilustremos cómo funciona una prueba t observando dos grupos de estudiantes graduados que han sido asignados a la misma clase. Les dimos a todos una prueba para determinar su nivel de conocimiento sobre el tema. Primero, enumeraremos las puntuaciones de datos que recopilamos:

Grupo 1Grupo 2
52
63
44
53
27

Nuestro número total de participantes es 10 y lo representaremos con la letra n , entonces n = 10. Necesitamos averiguar cuánta varianza hay dentro de todos los puntajes, por lo que calcularemos la media de cada grupo. La media del grupo 1 es 4,4 y la media del grupo 2 es 3,8. Para calcular la varianza, necesitamos calcular su desviación estándar , que se define como un número correspondiente a una curva de campana que describe qué tan dispersos están los datos.

El proceso de cálculo de la desviación estándar implica encontrar cuánto difiere cada puntaje del promedio, cuadrarlos, sumarlos y luego cuadrarlos. Muchas calculadoras y trampas en línea le permitirán hacerlo rápidamente, y pocos estadísticos lo calcularán a mano. Si está interesado en cómo hacer un cálculo más detallado, consulte la lección que lo detalla. La desviación estándar del Grupo 1 es 1,52 y la desviación estándar del Grupo 2 es 1,92.

El primer paso de la prueba t es calcular cuánta variabilidad hay en la muestra. Esta parte de la fórmula nos ayudará a informarnos si las diferencias entre las muestras podrían explicarse por la dispersión de los datos. La fórmula es simplemente elevar al cuadrado cada desviación estándar, luego dividir por el número de números en el grupo y luego sumarlos.

Entonces, (1.52 ^ 2/5) + (1.92 ^ 2/5). Esto se convierte en 0.462 + 0.737, lo que equivale a 1.199. Luego, hacemos la raíz cuadrada de este número para darnos la variabilidad dentro del grupo (desviación estándar). Esto nos da 1.095. Este número representa cuánta variabilidad hay en nuestros grupos.

La fórmula funciona al observar la variabilidad de los grupos (la desviación estándar) y cuántas personas hay en ella. Si la desviación estándar es menor o hay más personas en el estudio, entonces la variabilidad de los grupos sería menor.

Ahora, finalmente llegamos a calcular nuestro valor t. La fórmula es simplemente el promedio del primer grupo menos el promedio del segundo grupo, todo lo cual se divide por la varianza dentro de los grupos. Entonces, 4.4 – 3.8 / 1.199. Esto equivale aproximadamente a 0,5.

Luego verificaríamos una tabla de valores t y determinaríamos si nuestro valor calculado excede el número de la tabla. Para usar la tabla de valores t y obtener el número de tabla correcto para comparar nuestro valor calculado, necesitamos tener grados de libertad , que son el número de puntajes usados ​​después del cálculo. Cada componente de las estadísticas en nuestra fórmula nos cuesta un grado de libertad, por lo que en el proceso de crear las desviaciones estándar, perdimos dos grados de libertad.

La razón detrás de esto se complica estadística y matemáticamente. Es más fácil recordar que al consultar la tabla de la prueba t, tenemos el número total de puntajes en nuestras dos muestras menos 2. Tenemos 10 puntajes en nuestra muestra, eso significaría que tenemos 8 grados de libertad (10 – 2 es 8).

Lamentablemente, las tablas son propiedad de las empresas de estadística y no puedo mostrarles ninguna. Sin embargo, una búsqueda en la web o cualquier libro estadístico le dará la tabla. Exploramos la columna hasta llegar a 8, nuestros grados de libertad. Para tener un resultado estadísticamente significativo con 8 grados de libertad, nuestro valor t calculado debe estar por encima de 2,31. Nuestro 0,5 no supera el 2,31; por tanto, no podemos rechazar la hipótesis nula. Parece que no hay una diferencia significativa entre nuestros dos grupos. Esto probablemente se deba a su pequeño tamaño y a su desviación estándar relativamente grande.

Resumen de la lección

La prueba t , o prueba t de Student es una prueba estadística para determinar si hay una diferencia medida entre dos grupos. Prueba la hipótesis nula , definida como la predicción de que no hay interacción entre las variables y el supuesto de que no hay diferencia entre los grupos.

A esto se opone la hipótesis alternativa , también conocida como hipótesis de investigación, definida como la predicción de que hay una interacción medida entre las variables, lo que significa que estamos viendo si hay una diferencia significativa entre los grupos.

Al calcular el valor t, debemos recordar que perdemos dos grados de libertad , que son el número de puntajes utilizados después del cálculo al calcular la desviación estándar , que se define como un número correspondiente a una curva de campana que describe cómo se extendió los datos son.

Los resultados del aprendizaje

Después de completar la lección, debería poder:

  • Definir qué son las pruebas t y por qué son necesarias
  • Comprender las diferencias entre hipótesis nula y alternativa.
  • Recuerde la fórmula para calcular el valor t, perder 2 grados de libertad y encontrar la desviación estándar

¡Puntúa este artículo!