¿Qué es una prueba de chi-cuadrado? – Definición y ejemplo

Publicado el 21 septiembre, 2020

Definiciones involucradas en la prueba de chi-cuadrado

Últimamente he estado leyendo mucho sobre oficiales encubiertos y me hizo comenzar a preguntarme cuántos oficiales de policía trabajan encubiertos versus cuántos solicitan estar en el programa. Quiero decir, no todos los que se postulan pueden trabajar encubiertos porque es posible que no se ajusten a una necesidad o sus puntajes en las pruebas psicológicas simplemente no estén a la altura.

Si los números fueran realmente cercanos entre los que solicitaron y los que ingresaron, necesitaríamos saber si hay una diferencia estadísticamente significativa. Significa estadísticamente significativa que la diferencia en los resultados no se produjo por azar. Esto casi siempre está representado por una p minúscula , que significa probabilidad.

Si ha leído algún artículo de investigación psicológica, es posible que haya visto p <.05, lo que significa que la probabilidad de que estos resultados sean una casualidad es menor de 1 en 20 veces. Este ha sido el nivel acordado de probabilidad de que los resultados puedan ser incorrectos durante bastante tiempo. Veremos cómo lo calculas para un chi-cuadrado en solo un momento.

Lo que necesitamos es una prueba estadística específica que nos permita tomar datos categóricos, como los que ingresaron al programa encubierto y los que no. Lo que necesitamos es un chi-cuadrado , que es una prueba estadística que se utiliza para comparar los datos esperados con lo que recopilamos.

Lo que nos dirá un chi-cuadrado es si hay una gran diferencia entre los números recopilados y los esperados. Si la diferencia es grande, nos dice que puede haber algo que esté causando un cambio significativo. Una diferencia significativamente grande nos permitirá rechazar la hipótesis nula , que se define como la predicción de que no existe interacción entre variables. Básicamente, si hay una diferencia lo suficientemente grande entre los puntajes, entonces podemos decir que sucedió algo significativo. Si los puntajes son demasiado cercanos, entonces tenemos que concluir que son básicamente los mismos.

Estadísticas

La fórmula real para ejecutar un chi-cuadrado es realmente muy simple:

( oe ) ^ 2 / e

Toma los datos observados ( o ) y resta lo que esperaba ( e ). Cuadre los resultados y luego divida por los datos esperados en todas las categorías.

Para usar el número que encontramos, nos referimos a los grados de libertad , generalmente etiquetados como df para abreviar, y se define para el chi-cuadrado como el número de categorías menos 1. Debido a la naturaleza de la prueba de chi-cuadrado, siempre usará el número de categorías menos 1 para encontrar los grados de libertad. La razón por la que se hace esto es porque se supone que los datos de la muestra están sesgados, y esto ayuda a cambiar las puntuaciones para permitir errores.

Luego, ubicará una tabla de distribución de chi-cuadrado, que se encuentra en casi todos los libros de texto de estadística impresos. Usando sus grados de libertad, localizará el valor p que le interesa usando el proceso a continuación; típicamente el valor p es .05. Si puede, vea si su número es mayor que .01, lo que significa que sus resultados solo podrían ocurrir al azar 1 de cada 100 veces. Debido a problemas de restricción de derechos de autor, no podremos proporcionar una imagen completa de la tabla de distribución de chi-cuadrado, pero a continuación se muestra básicamente cómo se ven y cómo encuentra el dígito que está buscando.


Así es como suele verse una tabla de distribución de chi-cuadrado.
ejemplo de tabla de distribución de chi-cuadrado

Para encontrar su valor p , siga la columna de la izquierda de los grados de libertad. Si tenemos 10 categorías, tenemos 9 grados de libertad. Nos moveríamos 9 lugares hacia abajo en el lado izquierdo. A continuación, seguiremos la fila de 9 grados de libertad hacia la derecha hasta llegar al nivel .05. Si el número de su fórmula es mayor que el que se encuentra en la tabla, entonces tiene un hallazgo estadísticamente significativo. Es como jugar Battleship, excepto que tiene grados de libertad y el valor p .

Si su número está más cerca de uno de los otros valores en sus grados de libertad, entonces reportará ese valor p . Cada uno de los otros niveles tiene diferentes valores de p , generalmente .95, .50, .25, etc. Esto permite a los investigadores que no tienen resultados significativos informar sus valores p . Si su valor no es mayor que el valor .05 pero es mayor que el valor .25, entonces esto significa que su p > .25, y por lo tanto, no está dentro del límite de probabilidad aceptable.

Una última cosa acerca de ejecutar un chi-cuadrado: el número de observados o esperados no puede ser inferior a cinco. Este es un número demasiado bajo para que las estadísticas lo manejen y básicamente da como resultado hallazgos no válidos.

Ejemplo

Esto se aclarará un poco cuando veamos un ejemplo. Digamos que tenemos oficiales de policía encubiertos y nuestros oficiales que solicitaron ingresar al programa encubierto pero no lograron ingresar. Sacando números de la nada, digamos que 500 oficiales se postularon en total, y 200 fueron contratados como oficiales encubiertos. Nuestra pregunta de investigación será: ‘Si esperamos que la mitad de los oficiales que se postulen al programa ingresen, ¿hay alguna diferencia entre nuestras expectativas y las observadas?’

Si esperáramos que la mitad de los solicitantes ingresaran, eso significaría que esperamos que ingresen 250. Nuestra fórmula se ve así:

(200 – 250) ^ 2/250
-50 ^ 2/250
10

Luego revisamos nuestra tabla y encontramos que a 1 grado de libertad, debido a que solo tenemos dos categorías (oficiales en el programa y oficiales rechazados del programa), encontramos que el valor p es 3.84. Esto significa que algo está sucediendo y que hay una diferencia estadísticamente significativa entre el número de agentes encubiertos esperados y el número que realmente hay.

Resumen de la lección

Cuando se observan datos categóricos, los datos estadísticamente significativos (definidos como la diferencia en los resultados no se produjo por azar) se encuentran mediante el uso de un chi-cuadrado , que es una prueba estadística que se utiliza para comparar los datos esperados con lo que recopilamos. Con esto, se puede probar la hipótesis nula , que se define como la predicción de que no existe interacción entre las variables.

Los resultados del aprendizaje

Después de completar esta lección en video, debería poder:

  • Definir significación estadística
  • Explicar el propósito de usar una prueba de chi-cuadrado.
  • Identificar la fórmula para ejecutar un chi-cuadrado
  • Describe cómo usar una tabla de distribución de chi-cuadrado.

¡Puntúa este artículo!