Fiabilidad en psicología: Definición, tipos y ejemplos

Rodrigo Ricardo Publicado el 14 noviembre, 2020 10 minutos y 12 segundos de lectura

Fiabilidad en psicología

La confiabilidad en psicología es el grado en que una escala o medida particular produce puntuaciones o resultados consistentes en múltiples usos. Esto es importante porque ayuda a los psicólogos a determinar el valor o la utilidad de una prueba psicológica determinada. Por ejemplo, imagine que un individuo usa una báscula para medir cuánto pesa en el transcurso de un mes. Después de usar la báscula una vez por semana, encuentran los siguientes resultados:

  • Semana 1: 156 libras
  • Semana 2: 319 libras
  • Semana 3: 42 libras
  • Semana 4: 101 libras

Aunque el peso de una persona puede fluctuar en el transcurso de un mes, no hay forma de que pueda fluctuar tanto. En este caso, la báscula proporciona poco o ningún valor para ayudar a la persona a determinar cuánto pesa. Deberían conseguir una escala más fiable. Lo mismo ocurre con los psicólogos que quieren medir conductas específicas. Deberían utilizar escalas que proporcionen mediciones consistentes a lo largo del tiempo. De lo contrario, los psicólogos no pueden obtener mediciones precisas de sus variables de interés.

Tipos de confiabilidad en psicología

Hay diferentes formas de determinar la confiabilidad en psicología.

Fiabilidad de prueba y repetición

La confiabilidad test-retest se determina administrando la misma prueba repetidamente. Esto a menudo implica el uso de diferentes versiones del examen para que la persona que lo realiza no reciba las mismas preguntas cada vez que lo realiza. Por ejemplo, una prueba de inteligencia confiable debería mostrar altos niveles de confiabilidad test-retest, ya que se cree que la inteligencia es un rasgo bastante estable. Alguien que obtenga una puntuación alta en una prueba de inteligencia hoy debería obtener una puntuación similar la próxima semana. Al igual que en el ejemplo anterior del uso de una báscula para medir el peso, una prueba de inteligencia que produce puntuaciones inconsistentes a lo largo del tiempo no es una medida confiable de inteligencia.

La confiabilidad test-retest se determina correlacionando las puntuaciones de la prueba cada vez que se administra. Si la correlación entre las puntuaciones de la prueba es lo suficientemente alta, se puede decir que la prueba tiene una alta confiabilidad test-retest.

Fiabilidad entre

Las pruebas psicológicas a menudo implican observaciones por parte de los investigadores que administran la prueba. La confiabilidad entre evaluadores es el grado en que las observaciones realizadas por diferentes observadores son consistentes. Por ejemplo, los estudios a menudo involucran a dos investigadores separados a quienes se les asigna la responsabilidad de registrar las respuestas de los examinados.

La confiabilidad entre evaluadores se determina correlacionando las puntuaciones de cada observador durante un estudio. Si la correlación entre las diferentes observaciones es lo suficientemente alta, se puede decir que la prueba tiene una alta confiabilidad entre evaluadores.

Fiabilidad de formas paralelas

La confiabilidad de formas paralelas, también conocida como confiabilidad de formas alternativas, se produce cuando diferentes formas de una prueba producen puntuaciones consistentes. Por ejemplo, alguien que quiera crear una nueva prueba de inteligencia puede determinar si las puntuaciones de la nueva prueba son consistentes con las puntuaciones de otra prueba de inteligencia que ya se ha considerado confiable.

La confiabilidad de las formas paralelas se determina correlacionando las puntuaciones de ambas formas de la prueba. Si la correlación entre las diferentes medidas es lo suficientemente alta, se puede decir que la prueba tiene una alta confiabilidad de formas paralelas.

Fiabilidad de coherencia interna

Un aspecto importante de la confiabilidad es que los ítems dentro de la prueba en sí deben ser consistentes. Por ejemplo, si alguien crea una nueva prueba para medir la inteligencia, las preguntas individuales de la prueba deberían producir respuestas similares si todas miden el mismo concepto. Esto se conoce como consistencia interna.

La consistencia interna se puede determinar utilizando dos tipos diferentes de correlaciones. El primero se llama correlaciones entre ítems y esto implica calcular una correlación entre todos los pares posibles de ítems de la prueba. Luego, se calcula un promedio. Si el promedio es lo suficientemente alto, la prueba tiene una alta consistencia o confiabilidad entre ítems.

La segunda forma de encontrar la coherencia interna es encontrar la confiabilidad dividida por la mitad. Básicamente, una prueba se divide en dos mitades iguales y se realiza una correlación para determinar si las mitades son consistentes. Si esta correlación es lo suficientemente alta, se dice que la prueba tiene una confiabilidad dividida por la mitad alta y se considera internamente consistente o confiable.

Ejemplo de confiabilidad en psicología

León acaba de crear una nueva medida de vocabulario temprano. Antes de utilizar su nueva prueba, necesita determinar si es una escala confiable o no. Para establecer la confiabilidad de la prueba y la repetición, León administra la nueva escala dos veces al mismo grupo de niños en edad preescolar durante un período de una semana. Después de obtener sus resultados, realiza una correlación y descubre que las puntuaciones de ambos períodos son consistentes, lo que sugiere que su nueva prueba tiene una alta confiabilidad test-retest.

Para establecer la confiabilidad entre evaluadores, emplea a dos investigadores separados para administrar y calificar la prueba. Luego, realiza una correlación y descubre que las puntuaciones de ambos observadores son consistentes, lo que sugiere que su nueva prueba tiene una alta confiabilidad entre evaluadores. Para establecer la confiabilidad de las formas paralelas, compara los puntajes de su prueba con los obtenidos de una prueba comúnmente utilizada por los investigadores del lenguaje llamada Peabody Picture Vocabulary Test (PPVT). Luego, realiza una correlación y descubre que las puntuaciones de su prueba son consistentes con las del PPVT.

Finalmente, León quiere establecer coherencia interna. Para ello, administra su prueba y divide los resultados en dos mitades iguales. La primera mitad contiene las preguntas 1 a 25 y la segunda mitad contiene las preguntas 26 a 50. Realiza una correlación y descubre que las dos mitades están altamente correlacionadas, lo que sugiere que su prueba es internamente consistente. Después de realizar múltiples pruebas de confiabilidad, León concluye que su nueva escala es una prueba confiable de vocabulario que produce puntuaciones consistentes.

Fiabilidad versus validez

La confiabilidad y la validez a menudo se discuten en el mismo contexto. ¿En qué se diferencian? Mientras que la confiabilidad se refiere al grado en que una prueba arroja puntajes consistentes, la validez se refiere al grado en que una prueba mide lo que pretende medir. Por ejemplo, un psicólogo que se decida a medir la creatividad tendrá que asegurarse de que su prueba no mida conceptos relacionados, como inteligencia o ética laboral. De lo contrario, es posible que el psicólogo no mida lo que se propone medir. Los investigadores buscan medidas que sean válidas y consistentes al estudiar los fenómenos psicológicos.

Resumen de la lección

La confiabilidad es el grado en que una prueba produce puntajes consistentes. Es importante porque una prueba inconsistente proporciona poco valor para ayudar a los investigadores a producir mediciones precisas. La confiabilidad se determina calculando los coeficientes de correlación de confiabilidad. Se cree que las pruebas que producen resultados altamente correlacionados son escalas confiables.

Hay diferentes formas de probar la confiabilidad de una escala determinada. La confiabilidad de prueba y repetición implica administrar una prueba varias veces. La confiabilidad entre evaluadores implica comparar las puntuaciones o calificaciones de diferentes observadores para garantizar la coherencia. La confiabilidad de formas paralelas implica comparar la consistencia de dos formas diferentes de una prueba. La confiabilidad interna es una forma de determinar si los elementos individuales de una prueba son consistentes o no.

Definición de confiabilidad

La confiabilidad es la capacidad de una prueba o evaluación para producir los mismos resultados cuando se administra repetidamente. Sería difícil confiar en los resultados de una prueba que arroja resultados sorprendentemente diferentes cuando se administra al mismo participante en una proximidad temporal entre sí. Una prueba que es confiable no necesariamente es válida ni mide lo que se pretende medir. Una prueba puede ser confiablemente inexacta. La confiabilidad es un aspecto importante de la calidad de la evaluación y algo a lo que los diseñadores y administradores de la evaluación prestan mucha atención.

Determinación de la confiabilidad

En el mundo de la psicología, la confiabilidad se asocia con mayor frecuencia con cosas como pruebas de inteligencia, evaluaciones de comportamiento y medidas de autoinforme. Cada vez que los investigadores están interesados ​​en recopilar información o hacer preguntas, quieren estar seguros de que las herramientas que utilizan para recopilar información son confiables.

La confiabilidad se determina calculando el coeficiente de correlación entre conjuntos repetidos de puntajes de evaluación. Si el coeficiente de correlación es 0,80 o superior, normalmente se considera una prueba confiable. Observe que para que una prueba se considere confiable, no es necesario que arroje una correlación positiva perfecta de 1,0. Incluso las pruebas diseñadas con mayor precisión no son perfectas. Factores como preguntas y formatos mal diseñados pueden afectar las puntuaciones y, posteriormente, influir en el coeficiente de confiabilidad. Otro factor es el hecho de que cuanto más se exponen los sujetos de prueba a las preguntas, más se familiarizan con ellas.

Ejemplo de confiabilidad

Echemos un vistazo a un ejemplo para ayudar a ilustrar el concepto de confiabilidad.

Charlie es un psicólogo investigador que ha estado estudiando la memoria. Cree que ha desarrollado una evaluación de la memoria a corto plazo muy precisa. Una parte importante de la evaluación de cuán útil podría ser su nueva evaluación es determinar cuán confiable es esta nueva medida de la memoria a corto plazo. Su evaluación arroja posibles puntuaciones de 0 a 100, donde 0 representa capacidades débiles de memoria a corto plazo y 100 representa fuertes. Charlie recluta a 15 sujetos para realizar su nueva prueba de memoria a corto plazo, registra sus puntuaciones y luego les pide a todos que realicen la misma prueba de memoria a corto plazo al día siguiente. Sus resultados se pueden ver en la siguiente tabla:

Puntuación 1Puntuación 2
9890
8975
1285
4556
9590
8963
1278
7812
2526
4579
2021
10099
4645
8084
8587

Utilizando las puntuaciones resultantes de esta muestra se deriva un coeficiente de correlación de 0,39. Si recuerda, normalmente se requiere una correlación de 0,80 para que una prueba se considere confiable. Desafortunadamente para Charlie, tendrá que revisar de nuevo el diseño de su evaluación de la memoria a corto plazo.

Entonces, Charlie vuelve a la mesa de dibujo, reconsidera su línea de preguntas y otras características de la prueba, recluta a 15 nuevos participantes y repite el mismo procedimiento para evaluar la confiabilidad que hizo en la prueba anterior. Echa un vistazo a estos resultados:

Puntuación 1Puntuación 2
8988
7581
7472
2322
4547
3538
7475
1256
5655
4546
2345
4545
7980
sesenta y cinco66
7071

Los resultados de su prueba de memoria a corto plazo recientemente diseñada revelan una correlación de 0,85, que no sólo ha mejorado mucho, sino que también es una fuerte correlación positiva entre las dos administraciones separadas de la prueba. Charlie ahora puede decir con cierto grado de confianza que su prueba de memoria a corto plazo es confiable y arroja resultados altamente correlacionados cuando se administra repetidamente.

Resumen de la lección

La confiabilidad es la capacidad de las pruebas y otras herramientas de evaluación para producir resultados similares cuando se administran repetidamente a lo largo del tiempo. La confiabilidad es un aspecto importante en el desarrollo de pruebas de inteligencia, evaluaciones de comportamiento y medidas de autoinforme de alta calidad, así como una característica de la prueba a la que los desarrolladores de evaluaciones prestan mucha atención. La confiabilidad se mide correlacionando los resultados de la incidencia de la administración de múltiples pruebas. Eso es lo que estamos tratando de encontrar: una correlación. Un resultado de coeficiente de correlación de 0,80 o superior suele considerarse una prueba fiable. Si el coeficiente resultante es inferior a 0,80, entonces será necesario rediseñar la medida o seleccionar una prueba alternativa para su uso.

Explora más sobre este tema

Selecciona un tema y sigue aprendiendo...

Rodrigo Ricardo
Rodrigo Ricardo Editor y fundador