Variable de confusión: definición y ejemplo

Rodrigo Ricardo Publicado el 22 noviembre, 2020 3 minutos y 35 segundos de lectura

Las variables de confusión son variables extrañas

Cuando realizamos experimentos, nuestro objetivo es demostrar las relaciones de causa y efecto entre las variables independientes y dependientes. Las variables externas no son ninguna de las variables investigadas, sino más bien son variables adicionales que influyen en las variables investigadas. Un tipo de variable extraña es una variable de confusión.

En los estudios de causa y efecto donde solo se incluyen dos variables en el diseño, no hay variables de confusión. Las variables de confusión se convierten en una molestia en los estudios con tres o más variables.

Las variables de confusión son dos o más variables independientes cuyos efectos son difíciles de analizar; el efecto de una variable independiente sobre la variable dependiente no se puede distinguir de la otra variable independiente.

Un ejemplo hipotético de variables de confusión

Una universidad muy prestigiosa quiere comprender mejor las características que conducen a puntajes más altos en el examen de matemáticas SAT. Un analista teoriza que cuantas más clases de matemáticas tome un estudiante en la escuela secundaria tendrá el efecto más fuerte en la puntuación de matemáticas de un estudiante, mientras que otro analista teoriza que cuanta más experiencia tenga el maestro de matemáticas tendrá el efecto más fuerte en la puntuación de matemáticas de un estudiante.

Cada analista ejecuta su propio análisis usando los mismos datos, con solo esta diferencia: el primer analista usa la clase de matemáticas más alta como su variable independiente, pero incluye la experiencia del maestro en el diseño, mientras que el otro usa la experiencia del maestro como su variable independiente, pero incluye clase de matemáticas más alta en el diseño. ¡He aquí, encuentran los mismos resultados!

Cada uno de los analistas puede afirmar que su variable independiente explica las diferencias observadas en el puntaje de matemáticas del SAT de un estudiante. ¿Cómo es esto? Los analistas realizan un tercer análisis y encuentran que sus variables independientes tienen una correlación positiva muy fuerte. A medida que aumenta la variable clase de matemáticas más alta, la experiencia del maestro variable aumenta simultáneamente.

Estas variables se confunden. Un estudiante cuya clase más alta de matemáticas es estadística probablemente esté en la misma clase que el maestro que tiene más experiencia. Un estudiante cuya clase más alta de matemáticas es pre-álgebra está en la misma clase que el maestro que tiene menos experiencia. Entonces, ¿qué variable usamos para explicar por qué algunos estudiantes obtienen mejores puntajes en el examen de matemáticas SAT?

¿Qué hacer con los factores de confusión?

Existen procedimientos estadísticos que permiten a los analistas lidiar con variables de confusión. El primer paso es determinar qué tan correlacionadas están las variables de confusión. Si están muy correlacionados, entonces podría ser necesario eliminar uno de ellos del análisis.

Si no están muy correlacionados, ambos pueden incluirse en el análisis en un intento de evaluar el efecto de la variable independiente principal sobre la variable dependiente, manteniendo todas las demás cosas constantes.

Por eso es tan importante medir todas las variables que pueden estar relacionadas con la variable dependiente de interés. Sin una medición adecuada, el analista no puede utilizar estos controles en el análisis final.

Resumen de la lección

Las variables de confusión son dos o más variables independientes cuyos efectos son difíciles de analizar; el efecto de una variable independiente sobre la variable dependiente no se puede distinguir de la otra variable independiente.

Existen procedimientos estadísticos que permiten a los analistas lidiar con variables de confusión. El primer paso es determinar qué tan correlacionadas están las dos variables de confusión. Si están muy correlacionados, entonces podría ser necesario eliminar uno de ellos del análisis. Si no están muy correlacionados, ambos pueden incluirse en el análisis en un intento de evaluar el efecto de la variable independiente sobre la variable dependiente, manteniendo todas las demás cosas constantes.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador