Prueba de Chi-Cuadrado: Definición, propósito y ejemplos
Definición de la prueba de chi-cuadrado
Antes de realizar un experimento, un investigador debe desarrollar primero una hipótesis que declare una posible explicación comprobable para algún resultado de interés. Sin embargo, cuando se crea una hipótesis, debe acompañarla una hipótesis nula. Una hipótesis nula es una afirmación que hace que la hipótesis sea nula y sin efecto. Por ejemplo, si la hipótesis dice que los ratones recompensados con queso serán más competentes corriendo en laberintos, entonces la hipótesis nula debe afirmar que los ratones recompensados con queso no serán mejores corriendo en laberintos que los ratones no recompensados con queso.
Después de recolectar datos experimentales, es necesario determinar si las diferencias observadas, llamadas variaciones, se debieron al azar o a alguna de las variables estudiadas. Este paso es la parte en la que la pregunta de si el queso realmente hace que los ratones corran mejor el laberinto se responde con estadísticas. La significancia estadística se define como una forma de determinar matemáticamente si la probabilidad de que algo suceda se debió al azar o al efecto de alguna variable. Debido a que la significancia estadística mide la probabilidad de que un suceso sea genuino, su símbolo es la letra minúscula p. En algún momento de la historia de la estadística, se acordó mutuamente que era poco probable que un suceso con una probabilidad de 1 entre 20 ocurriera por pura casualidad y, por lo tanto, era estadísticamente significativo. Dado que 1 dividido por 20 es 0,05, si el valor de p es {eq}\le {/eq} 0,5, es estadísticamente significativo.
Este punto es donde entra en juego la definición de la prueba chi-cuadrado. Chi-cuadrado que significa {eq}\mathscr X^2 {/eq}o el cuadrado de chi ({eq}\mathscr X {/eq}). La prueba de chi-cuadrado es un método estadístico para calcular si las variaciones en los datos se deben a una de las variables probadas o al azar.
Chi-cuadrado
La prueba de chi-cuadrado solo puede comparar los resultados de datos que pueden organizarse en categorías, llamadas variables categóricas, por su significación estadística. También compara las probabilidades de resultados de los datos esperados con los recopilados. Si los datos no son categóricos, se debe utilizar otra prueba estadística, como la prueba T. Además, si no hay más de cinco resultados observados para cada categoría evaluada, la prueba de chi-cuadrado no funcionará. La fórmula para la prueba de chi-cuadrado es la siguiente:
$$\mathscr X^2 = \sum \frac{(O_i – E_i)^2}{E_i} $$
La fórmula se define mediante los siguientes elementos: {eq}\mathscr X {/eq} es chi, {eq}\sum {/eq} es ”la suma de”, {eq}O {/eq} es el resultado observado y {eq}E {/eq} es el resultado esperado. Volviendo al ejemplo del laberinto del ratón, el investigador recopiló los siguientes datos y los puso en una tabla:
Competente en el laberinto | No domina el laberinto | Totales de fila | |
---|---|---|---|
ratones de queso | 24 | dieciséis | 40 |
Sin ratones de queso | 18 | 22 | 40 |
Totales de columnas | 42 | 38 | 80 |
Son necesarios dos pasos antes de que cualquiera de los datos pueda conectarse a la ecuación de chi-cuadrado.
- Establecer el valor p o nivel alfa, que decide la significancia, debe ser al menos p = 0,05. El investigador decide con qué rigor quiere medir la importancia.
- Calcular la frecuencia esperada. La frecuencia esperada es la frecuencia de ocurrencia que se esperaría si la hipótesis nula fuera correcta. Para calcular este valor, utilice la siguiente ecuación para cada resultado: (total de fila x total de columna)/(total de observaciones).
Ejemplo de cálculo de la frecuencia esperada:
- Para ratones de queso que dominan el laberinto: (40 x 42)/(80) = 21
- Para ratones sin queso competentes en el laberinto: (40 x 42)/(80) = 21
- Para ratones de queso que no dominan el laberinto (40 x 38)/(80) = 19
- Para ratones sin queso que no dominan el laberinto (40 x 38)/(80) = 19
Si no hay relación entre el dominio del queso y el laberinto, la expectativa o frecuencia esperada es que 21 ratones con queso y ratones sin queso recorran el laberinto de manera competente, y que 19 ratones con queso y ratones sin queso no recorran el laberinto de manera competente. Una vez calculadas las tasas de frecuencia esperadas, estos valores y los datos experimentales ahora se pueden conectar a la fórmula chi-cuadrado.
$$\mathscr X^2 = \frac{(24 – 21)^2}{21} + \frac{(18 – 21)^2}{21} + \frac{(16 – 19)^2}{ 19} + \frac{(22 – 19)^2}{19} = 1,8045 $$
Antes de continuar con esta lección, primero deben definirse dos términos: grados de libertad y valores críticos.
- Grados de libertad. Los grados de libertad (gl) se calculan mediante el número total de resultados, o categorías, menos uno. Si un investigador lanza una moneda, hay dos categorías de resultados: cara o cruz (2 – 1 = 1; gl = 1). Si un investigador lanza un dado de 6 caras, hay seis resultados posibles: 1, 2, 3, 4, 5 o 6 (6 – 1 = 5; gl = 5). En el experimento del laberinto con el ratón, hay dos resultados posibles: el ratón recorre bien el laberinto o no lo recorre bien (2 – 1 = 1; df = 1).
- Valores criticos. Los valores críticos son los números en la tabla de distribución de chi-cuadrado ubicados en los puntos de cruce de las columnas de significancia estadística y las filas de grados de libertad.
En el ejemplo del laberinto del ratón, el valor p se estableció en p = 0,05. El valor de {eq}\mathscr X^2 {/eq} fue 1,80 y el gl = 1. En la tabla de distribución de chi-cuadrado, comience en el número 1 en la fila de grados de libertad y avance hacia la derecha a lo largo de la fila. deteniéndose en p = 0,05. El valor crítico indicado para ese punto de cruce es 3,84. Debido a que el valor calculado de {eq}\mathscr X^2 {/eq} es 1,80, que es menor que el valor crítico de 3,84, los resultados no son estadísticamente significativos y la hipótesis se rechaza. Los ratones alimentados con queso no recorrieron el laberinto mejor que los ratones a los que no se les dio queso. De hecho, el valor {eq}\mathscr X^2 {/eq} de 1,80 está en algún lugar entre los valores críticos de 1,32 (p = 0,25) y 2,71 (p = 0,10) 0,9, es decir, la probabilidad calculada para este estudio del laberinto del ratón. está entre p = 0,25 y 0,10, lo que no es estadísticamente significativo.
Para resumir:
- Si el valor de chi-cuadrado es mayor que el valor crítico, hay significancia estadística
- Si el valor de chi-cuadrado es menor que el valor crítico, no hay significancia estadística
Ejemplos de chi-cuadrado
El experimento del laberinto del ratón proporcionó un ejemplo de chi-cuadrado. Aquí hay dos ejemplos más que ayudan a comprender cómo aplicar la prueba de chi-cuadrado a datos categóricos:
Ejemplo 1
Un investigador diseña un estudio que analiza si los ratones prefieren comer maní o queso en función de su sexo. Sus datos fueron los siguientes:
comió maní | comió queso | Totales de fila | |
---|---|---|---|
ratones hembra | 13 | 2 | 15 |
ratones machos | 11 | 4 | 15 |
Totales de columnas | 24 | 6 | 30 |
En este caso, no se puede utilizar la prueba de chi-cuadrado. ¿Por qué? No hay más de cinco resultados observados para ratones hembra y machos que comieron queso. ¿Cómo podría un investigador resolver este problema? Necesitan incluir más ratones en el estudio.
Ejemplo 2
El investigador rehizo su estudio observando si los ratones prefieren comer maní o queso según su sexo, utilizando más ratones. Su hipótesis es que los ratones macho comerán más queso que maní en comparación con las hembras. Su hipótesis nula es que los ratones machos y hembras comerán cantidades estadísticamente equivalentes de maní y queso. El gl = 1 y el valor p se estableció en p = 0,05. Sus datos fueron los siguientes:
comió maní | comió queso | Totales de fila | |
---|---|---|---|
ratones hembra | 44 | 6 | 50 |
ratones machos | 34 | 18 | 52 |
Totales de columnas | 78 | 24 | 102 |
Cálculo de frecuencia esperada:
- Ratones hembra que comieron maní: (50 x 78)/(102) = 38
- Ratones machos que comieron maní: (52 x 78)/(102) = 40
- Ratones hembras que comieron queso: (50 x 24)/(102) = 12
- Ratones machos que comieron queso: (52 x 24)/(102) = 12
Al reemplazar estos valores en la ecuación de chi-cuadrado, el valor de {eq}\mathscr X^2 {/eq} es 7,25. Si observamos la tabla de distribución de chi-cuadrado, el valor crítico indicado para df = 1 es 3,84. El valor calculado de 7,25 es mayor que el valor crítico de 3,84, lo que indica que existe significancia estadística y se acepta la hipótesis.
Resumen de la lección
Cuando se dice que algo tiene significancia estadística, eso significa que es poco probable que la probabilidad del evento o suceso sea causado por pura casualidad. En estadística, la letra p minúscula se utiliza para representar la significancia estadística, que se ha establecido en un valor de {eq}p \le 0,5 {/eq}. Si los datos de la investigación son categóricos, es decir, se pueden separar en grupos, la prueba de chi-cuadrado es una forma de calcular si las variaciones en los datos se deben al azar o son estadísticamente significativas. La prueba de chi-cuadrado no puede comprobar la significancia estadística de los datos si no es categórica. La prueba de chi-cuadrado compara los resultados de los datos esperados y observados, se utiliza para determinar si una hipótesis es válida y para averiguar si las variables estudiadas son independientes o no.
Para calcular el valor de chi-cuadrado de datos categóricos, primero se debe calcular la frecuencia esperada, que es la frecuencia de eventos que ocurrirían si no fueran estadísticamente significativos. Una vez que se obtiene el valor de {eq}\mathscr X^2 {/eq}, es necesario calcular los grados de libertad (df). Los grados de libertad se determinan tomando el número total de categorías y restando 1. Por ejemplo, si un investigador estuviera estudiando si a los ratones machos y hembras les gusta comer maní, queso o manzanas, dado que hay 3 categorías, 3 – 1 = 2 y gl = 2. Por último, el valor gl y el valor p se utilizan para encontrar el valor crítico en una tabla de distribución de chi-cuadrado. Los valores críticos son números en una tabla de distribución de chi-cuadrado que determina si un evento es estadísticamente significativo. Si el valor de chi-cuadrado es mayor que el valor crítico, la hipótesis se apoya y si es menor que el valor crítico entonces no se apoya.
Articulos relacionados
- ¿Cuál es el propósito de la meditación en el budismo?
- Almacenamiento en búfer en computadoras: definición, propósito y estrategias
- Compensación Laboral: Definición, propósito y leyes
- ¿Qué es la prueba textil? – Métodos e Importancia
- Propiedades de confiabilidad de los sistemas: principios y propósito
- Definición del cormo, ejemplos y propósito
- Declaración de Independencia de Estados Unidos: Resumen, análisis y propósito
- Políticas y control de cuentas de usuario (UAC): definición y propósito
- Danza Litúrgica: Definición, características y propósito
- Tonsura: Propósito, historia y creencias religiosas