Problemas en la evaluación psicológica: confiabilidad, validez y sesgo

Publicado el 14 noviembre, 2020

Evaluación psicológica

Imagina que eres psicólogo y Kevin viene a verte. Recientemente ha tenido problemas para concentrarse. Se ha vuelto tan malo que incluso en medio de una conversación, a veces se olvida de con quién está hablando y de qué están hablando. Él piensa que algo podría estar muy mal con él.

Crees que Kevin podría tener razón en que algo anda mal. ¿Pero que? Hay muchos trastornos psicológicos que podrían causar los síntomas que tiene Kevin. Para diagnosticarlo, debes evaluarlo. Es decir, debe recopilar más información sobre Kevin y sus síntomas.

Las evaluaciones psicológicas vienen en muchas formas diferentes. Las entrevistas, las imágenes cerebrales, las pruebas genéticas y las pruebas de inteligencia son solo algunos tipos de evaluaciones psicológicas. Cada una de estas evaluaciones tiene sus fortalezas y debilidades, y un solo psicólogo puede utilizar varias evaluaciones con un paciente.

Entonces, digamos que elige qué evaluaciones usar en Kevin. ¿Cómo saber si las evaluaciones que elija realmente lo ayudarán? ¿Y si no te dan una buena respuesta? ¿Qué pasa si dicen que tiene un trastorno, pero en realidad no? Para asegurarse de que una prueba sea una buena evaluación, debe tener confiabilidad y validez. Además, debe estar libre de sesgos. Veamos cada una de estas cosas un poco más en profundidad.

Fiabilidad

¿Recuerdas a Kevin? Acude a usted con un problema y usted elige una evaluación para ayudarlo a diagnosticarlo. Por ejemplo, supongamos que desea realizar una resonancia magnética funcional , un tipo de exploración del cerebro, para ver si Kevin tiene un tumor. Así que pones a Kevin en la máquina de resonancia magnética y la computadora dice que no, Kevin no tiene un tumor. ¡Pero espera! La semana pasada, Kevin se hizo la misma prueba. Esa vez, demostró que tiene un tumor. ¿Que esta pasando?

En este caso, la evaluación (la fMRI) carece de fiabilidad. La confiabilidad es cuando una evaluación arroja constantemente los mismos resultados. Por supuesto, generalmente las máquinas de resonancia magnética funcional tienen una alta confiabilidad, pero el caso de Kevin es una excepción.

Veamos otro ejemplo de confiabilidad. Imagina que tienes una báscula de baño. Lo subes una mañana y dice que pesas 157 libras. Un minuto después, lo subes y dice que pesas 208 libras. Una tercera vez, te dice que pesas 81 libras. No está cambiando su peso de un minuto a otro, por lo que la báscula no es confiable.

Sin embargo, si se sube a la báscula tres veces seguidas y cada vez que la báscula lee 150 libras, es confiable. Por supuesto, generalmente hay alguna variación, por lo que incluso si la escala lee 155, 157 y 156, se podría decir que todavía tiene una alta confiabilidad. Hay dos tipos principales de confiabilidad que son importantes en las evaluaciones psicológicas: confiabilidad entre evaluadores y confiabilidad de prueba-reprueba.

La confiabilidad entre evaluadores se da cuando dos personas obtendrán la misma respuesta al usar la misma evaluación. Por ejemplo, digamos que tiene un cuestionario que le ayudará a diagnosticar a Kevin. Le haces las preguntas y él responde. A partir de sus respuestas, le diagnostica un trastorno por déficit de atención.

Pero luego Kevin va calle abajo con otro psicólogo. Ese psicólogo tiene el mismo cuestionario. Hace las mismas preguntas y obtiene las mismas respuestas de Kevin. Pero ella le diagnostica un trastorno obsesivo compulsivo. En este ejemplo, el cuestionario tiene una baja confiabilidad entre evaluadores. Si tuviera una alta confiabilidad entre evaluadores, cada vez que un psicólogo diferente usara el cuestionario y obtuviera las mismas respuestas de Kevin, él o ella llegaría con el mismo diagnóstico.

El otro tipo de confiabilidad es la confiabilidad test-retest , que es cuando una evaluación arroja la misma respuesta una y otra vez. ¿Recuerdas tu báscula de baño? Si las lecturas en la báscula son 157, 208 y 81 libras, tiene una confiabilidad de prueba-reprueba baja porque cada vez que se sube a la báscula, el número es muy diferente. Por otro lado, si lee 150 cada vez, tiene una alta confiabilidad test-retest.

Validez

Obviamente, es importante que una evaluación tenga una alta confiabilidad. Pero el hecho de que una evaluación sea confiable no significa que sea una buena medida de lo que está sucediendo. Volvamos al ejemplo de la báscula de baño. Si su báscula de baño lee 150 libras cada vez que la pisa, tiene una alta confiabilidad. Pero, ¿y si realmente pesa 200 libras? En este caso, su báscula es confiable, pero no válida.

La validez es cuando una evaluación mide con precisión lo que se supone que debe medir. Su báscula de baño tiene poca validez porque no mide su peso con precisión. Observe que la definición de validez tiene dos partes: una evaluación debe medir con precisión y debe medir lo que se supone que debe medir. Su báscula de baño puede estar midiendo el peso (lo que se supone que debe medir) pero no midiéndolo con precisión.

Por otro lado, ¿qué pasaría si su escala midiera con precisión otra cosa? Digamos que en lugar de medir su peso, como se supone que debe hacer, ¿su báscula en realidad mide el peso de solo la mitad derecha de su cuerpo? Puede obtener una lectura precisa, pero no es la lectura precisa que está buscando.

Volvamos a Kevin por un momento. Nuevamente, digamos que tiene un cuestionario para ayudarlo a diagnosticar si Kevin tiene trastorno por déficit de atención o no. Hay dos formas en que este cuestionario podría dejar de tener validez. Quizás no sea exacto y diga que todo el mundo tiene ADD. O tal vez no esté midiendo realmente ADD en absoluto.

La cuestión de la validez de constructo , o si una evaluación mide lo que se supone que debe medir, es común en psicología. Por ejemplo, ¿las pruebas de CI realmente miden la inteligencia? ¿Una prueba destinada a diagnosticar la depresión mide realmente el pesimismo? Son cuestiones de validez.

Parcialidad

Como ya hemos visto, una buena evaluación psicológica tiene tanto fiabilidad como validez. Pero también debería estar libre de prejuicios. El sesgo de evaluación se produce cuando diferentes grupos de personas obtienen constantemente resultados diferentes en una prueba. ¿Recuerdas ese cuestionario que tienes para ver si Kevin tiene ADD? ¿Qué pasaría si la forma en que se redactaron las preguntas significara que las personas rubias tienen más probabilidades de ser diagnosticadas con TDA que las morenas?

Aunque esto pueda parecer un ejemplo tonto, el sesgo de evaluación es un problema grave en las pruebas psicológicas. Los estudios han demostrado prejuicios de raza y género, así como otros prejuicios, en muchos tipos de evaluaciones. Las pruebas de inteligencia, las evaluaciones psicológicas y muchas otras evaluaciones pueden tener un sesgo. Sin embargo, las mejores evaluaciones psicológicas están libres de sesgos, son válidas y confiables.

Resumen de la lección

Las evaluaciones psicológicas ayudan a los psicólogos a diagnosticar y tratar a los pacientes. Hay tres problemas principales en las pruebas psicológicas: confiabilidad, validez y sesgo. La confiabilidad es cuando una prueba arroja constantemente los mismos resultados, ya sea a lo largo del tiempo o entre psicólogos. La validez es cuando una prueba mide con precisión lo que se supone que debe medir. Finalmente, las pruebas deben estar libres de sesgos , que es cuando diferentes grupos de personas obtienen constantemente puntajes diferentes en una evaluación.

Los resultados del aprendizaje

Después de terminar esta lección, es posible que descubra que puede:

  • Comprender la confiabilidad en una evaluación psicológica
  • Discernir la importancia de la validez en la medición.
  • Impartir la necesidad de una evaluación libre de sesgos

¡Puntúa este artículo!