Evaluación de asociaciones con chi-cuadrado
Si un día estuvieras comparando las calificaciones con las de tus amigos después de la clase y de repente se te ocurriera que todos los que usaban anteojos parecían obtener las mejores calificaciones, ¿podrías determinar si esto es realmente cierto? Puede validar estos datos estadísticamente creando y evaluando una prueba de chi-cuadrado , que mide las diferencias entre las frecuencias de datos esperadas y observadas.
Variables categóricas
Una condición previa de cualquier prueba de chi-cuadrado es que utilice medidas de variables categóricas , que son recuentos de datos tomados de categorías discretas mutuamente excluyentes. En nuestro caso, tenemos dos categorías de vista: usa anteojos o no, y todos los estudiantes de la muestra deben encajar en una de esas dos categorías. Nuestras calificaciones también deben caer en categorías específicas, como calificaciones con letras A, B, C, D, F, en lugar de usar porcentajes o alguna otra medida numérica.
Hay varios tipos de pruebas que utilizan la estadística de chi-cuadrado. En esta lección, derivaremos una prueba de independencia de chi-cuadrado , que determina si dos variables categóricas están relacionadas entre sí. Usamos un cálculo de chi-cuadrado y probabilidades de chi-cuadrado para hacer esa evaluación.
Fundamentos de cálculo
La estadística de chi-cuadrado se basa en la varianza de cada observación con el recuento que se esperaría si no hubiera relación entre las variables. Esta comparación a menudo se denomina hipótesis nula . Dicho de otra manera, la hipótesis nula simplemente declara que las dos variables son independientes. Una pequeña varianza confirma la hipótesis nula, lo que indica que las variables no están relacionadas, mientras que una gran varianza indica que las variables están relacionadas.
La fórmula de chi-cuadrado usa la suma de las diferencias al cuadrado para calcular la varianza. Tenga en cuenta que debemos proporcionar un valor esperado para cada categoría. Se puede usar un promedio si esperamos que los datos se distribuyan al azar, o los valores esperados se pueden tomar de cualquier curva de distribución supuesta, como una curva normal, sesgada o logarítmica.
![]() |
Aquí O i son los recuentos observados y E i son los recuentos esperados.
En nuestro caso, supongamos que hay 50 estudiantes en la clase y la mitad de ellos usa anteojos. En la siguiente tabla, mostramos el recuento de calificaciones esperado, si las calificaciones se distribuyeron normalmente, y las calificaciones reales. Generamos un valor de varianza para cada par de números según la ecuación, y los sumamos para obtener nuestra estadística de chi-cuadrado, que en este caso es 6.7444 + 9.1111 = 15.8555.
| Grado | Gafas esperadas | Gafas Observadas | Gafas de variación | No se esperan gafas | Observado sin gafas | Varianza sin gafas |
|---|---|---|---|---|---|---|
| UNA | 3 | 5 | 1.3333 | 3 | 1 | 1.3333 |
| segundo | 6 | 10 | 2.6667 | 6 | 2 | 2.6667 |
| C | 9 | 7 | 0.4444 | 9 | 10 | 0.1111 |
| re | 5 | 2 | 1.8000 | 5 | 10 | 5.0000 |
| F | 2 | 1 | 0.5000 | 2 | 2 | 0,0000 |
| Varianza total | 6.7444 | 9.1111 |
Analizando el resultado
En este ejemplo, nuestra hipótesis nula es que no existe correlación entre el uso de anteojos y las calificaciones de las pruebas que alguien recibe. Primero, considere el caso poco probable de que los valores observados sean exactamente los mismos que los valores esperados, lo que daría un valor de 0 en todos los cálculos. La diferencia o varianza cero indica que la hipótesis nula es exactamente cierta y que las dos variables son totalmente independientes.
¿Qué papel jugaron las mujeres en la independencia chilena?
En este caso, ¿qué significa un número como 15,8555? Para analizar el valor de chi-cuadrado, primero necesitamos encontrar el número de grados de libertad en los datos. Los grados de libertad son una medida de cuánto puede variar una observación y se calculan como uno menos que el número de niveles en cada categoría, multiplicados juntos. En nuestro caso tenemos 2 categorías de vista y 5 categorías de calificaciones, y los grados de libertad se calculan como:
(2 – 1) * (5 – 1) = 1 * 4 = 4
En este punto, podemos hacer referencia a tablas de búsqueda que relacionan los grados de libertad y los valores de chi-cuadrado con su probabilidad esperada, o podemos usar una calculadora estadística para calcular un valor de probabilidad de chi-cuadrado. Queremos determinar la probabilidad de que ocurra una desviación mayor que el valor de chi-cuadrado simplemente por casualidad. En nuestro caso, el valor de probabilidad calculado es 0,0032, o 0,32%, que es muy pequeño. A menudo se utiliza un valor de 0,05 o 5% como punto de corte para la significación estadística. Nuestro pequeño valor indica que hay muy poca probabilidad estadística de que nuestros puntos de datos sean aleatorios o no estén relacionados. Dado eso, rechazamos la hipótesis nula y concluimos que son atributos relacionados.
Si bien hemos confirmado estadísticamente nuestra sospecha original, la prueba de chi-cuadrado no implica ninguna relación de causa y efecto. Usando esta prueba, simplemente hemos confirmado que, dados los datos que tenemos disponibles, estas dos variables categóricas tienen una relación estadística válida.
Resumen de la lección
La prueba de independencia de chi-cuadrado es una medida estadística que se utiliza para encontrar la diferencia entre los datos esperados y los observados. La prueba solo se puede utilizar con recuentos de valores categóricos , no con medidas o porcentajes. La prueba intenta probar la hipótesis nula , que establece que los valores que se comparan son independientes y no están relacionados. El cálculo usa la varianza de los valores observados y esperados, y luego usa los grados de libertad en los datos para analizar si esas diferencias son estadísticamente significativas o no.
Independencia de México (1810–1821): Historia, acontecimientos y resumen
Explora más sobre este tema
Selecciona un tema y sigue aprendiendo...

