El coeficiente de confiabilidad y la confiabilidad de las evaluaciones

Publicado el 22 septiembre, 2020

Definición

Estudiante uno: Me alegro de que haya terminado. Es estresante actuar y ser evaluado por tres profesores.

Estudiante Dos: Estoy de acuerdo. También me preocupa cómo nos puntuará cada profesor individual. ¡Espero que utilicen los mismos criterios!

Estudiante uno: Oh, te refieres a la confiabilidad de los puntajes. ¿Conoce la fiabilidad?

Estudiante dos: En realidad no. Nunca antes había usado ese término.

Estudiante uno: ¡Oh! ¡Lo explicaré!

La confiabilidad se define como la medida en que una evaluación arroja información consistente sobre los conocimientos, habilidades o habilidades que se evalúan. Una evaluación confiable es replicable, lo que significa que producirá puntajes u observaciones consistentes del desempeño del estudiante.

Por ejemplo, nuestras interpretaciones de canto deberían resultar en puntajes similares de los tres maestros. Si un profesor nos da una puntuación de 10 sobre 10 y el otro nos da una puntuación de 2 sobre 10, las puntuaciones no se consideran fiables.

Estudiante dos: Oh, está bien. Entonces, parece que muchos factores podrían afectar la confiabilidad de una prueba o rendimiento.

Estudiante uno: Tienes razón.

Condiciones que afectan la confiabilidad

Estudiante uno: Hay muchas condiciones que afectan la confiabilidad. Incluyen:

  • Cambios diarios en el estudiante (como nivel de energía, motivación, estrés emocional y hambre)
  • Entorno físico (que incluye la temperatura del aula, los ruidos externos y las distracciones)
  • Administración de la evaluación (que incluye cambios en las instrucciones de la prueba y diferencias en cómo el maestro responde a las preguntas sobre la prueba)
  • Duración de la prueba (generalmente, cuanto más larga es la prueba, menor es la confiabilidad)
  • Subjetividad del anotador de la prueba

Medida de la fiabilidad: coeficiente de fiabilidad

Estudiante dos: Entonces, ¿cómo se mide la confiabilidad?

Estudiante uno: la confiabilidad se determina comparando dos conjuntos de puntajes para una sola evaluación (como dos puntajes de evaluador para la misma persona) o dos puntajes de dos pruebas que evalúan el mismo concepto. Estos dos puntajes se pueden derivar de diferentes maneras dependiendo del tipo de confiabilidad que se evalúe.

Una vez que tenemos dos conjuntos de puntuaciones para un grupo de estudiantes u observadores, podemos determinar qué tan similares son calculando una estadística conocida como coeficiente de confiabilidad.

El coeficiente de confiabilidad es un índice numérico de confiabilidad, que típicamente varía de 0 a 1. Un número más cercano a 1 indica alta confiabilidad. Un coeficiente de confiabilidad bajo indica más error en los resultados de la evaluación, generalmente debido a factores temporales que discutimos anteriormente. La confiabilidad se considera buena o aceptable si el coeficiente de confiabilidad es de .80 o superior.

Tipos de confiabilidad

Estudiante uno: Hay varios tipos de confiabilidad.

Fiabilidad entre

En otras palabras, ¿las diferentes personas califican el desempeño de los estudiantes de manera similar? Este tipo de confiabilidad se utiliza para evaluar el grado en que diferentes observadores o calificadores dan estimaciones o puntajes consistentes. Por ejemplo, actuamos frente a tres profesores que nos puntuaron individualmente. Una alta confiabilidad entre evaluadores indicaría que cada maestro nos calificó de manera similar.

Fiabilidad test-retest

Se utiliza para evaluar la coherencia de las puntuaciones de una evaluación de un momento a otro. El constructo que se va a medir no cambia, solo cambia el momento en que se administra la evaluación. Por ejemplo, si hoy nos dan un examen de ciencias y luego el mismo examen la semana que viene, podríamos usar esos puntajes para determinar la confiabilidad de la prueba-reprueba. La confiabilidad de prueba-reprueba se utiliza mejor para evaluar cosas que son estables en el tiempo, como la inteligencia. La fiabilidad suele ser mayor cuando ha pasado poco tiempo entre las administraciones de las evaluaciones.

Fiabilidad de formas paralelas

Este tipo de confiabilidad se determina comparando dos evaluaciones diferentes que se construyeron utilizando el mismo dominio de contenido. Por ejemplo, si nuestra maestra de ciencias creara una evaluación con 100 preguntas que miden el mismo contenido científico, dividiría la prueba en dos versiones con 50 preguntas cada una y luego les daría dos versiones de la prueba a sus alumnos. Ella usaría una puntuación de la versión 1 y una puntuación de la versión 2 para evaluar la confiabilidad de las formas paralelas.

Fiabilidad de consistencia interna

Esta forma de confiabilidad se utiliza para evaluar la consistencia de las puntuaciones en los elementos de una sola prueba. Por ejemplo, si nuestra maestra de ciencias desea probar la confiabilidad de la consistencia interna de sus preguntas de prueba sobre el método científico, incluiría varias preguntas sobre el mismo concepto. Una alta consistencia interna daría como resultado que todas las preguntas sobre métodos científicos se respondan de manera similar. Sin embargo, si las respuestas de los estudiantes a esas preguntas fueron inconsistentes, la confiabilidad de la consistencia interna es baja.

Aumento de la confiabilidad de las evaluaciones en el aula

Estudiante uno: Los educadores pueden aumentar o mejorar la confiabilidad de sus evaluaciones.

  • Pueden dar varias tareas o preguntas similares en una evaluación para buscar la coherencia del desempeño del estudiante.
  • Deben definir cada tarea con claridad para que los factores temporales, como la instrucción de la prueba, no afecten el rendimiento.
  • Si es posible, los educadores deben evitar evaluar el aprendizaje y el desempeño de los estudiantes cuando están enfermos o existen factores externos, como un ruido incontrolable en el aula.
  • Una última forma de aumentar la confiabilidad de las evaluaciones en el aula es que los educadores identifiquen criterios concretos específicos y utilicen una rúbrica con la que evaluar el desempeño de los estudiantes.

Resumen de la lección

La confiabilidad asegura la consistencia de los puntajes u observaciones del desempeño de los estudiantes. Los factores temporales externos e internos pueden afectar la confiabilidad, como los cambios diarios en el estudiante, los factores del entorno físico y la subjetividad del calificador.

La confiabilidad se mide a través del coeficiente de confiabilidad con un rango de índice numérico de 0 a 1. 1 indica alta confiabilidad, mientras que 0 indica menor. Los diferentes tipos de confiabilidad ( interevaluador , prueba-reprueba , formas paralelas y consistencia interna ) miden diferentes aspectos, pero todos utilizan el rango de coeficientes de confiabilidad estándar. Generalmente, una confiabilidad de .80 o superior indica una confiabilidad buena o aceptable.

Los resultados del aprendizaje

Después de ver esta lección, debería poder:

  • Defina la confiabilidad y enumere las condiciones que la influyen
  • Explicar cómo se mide la confiabilidad y cómo se puede aumentar en las evaluaciones.
  • Identificar y describir los tipos de confiabilidad

¡Puntúa este artículo!