Rodrigo Ricardo

Validez en las evaluaciones: contenido, construcción y validez predictiva

Publicado el 22 septiembre, 2020

Validez: definida

El término validez tiene diversos significados según el contexto en el que se utilice. La validez generalmente se refiere a la precisión con la que una conclusión, medición o concepto corresponde a lo que se está probando. Para esta lección, nos centraremos en la validez de las evaluaciones.

La validez se define como la medida en que una evaluación mide con precisión lo que se pretende medir. Permítanme explicar este concepto a través de un ejemplo del mundo real. Si se pesa en una báscula, la báscula debería darle una medida precisa de su peso. Si la báscula le dice que pesa 150 libras y en realidad pesa 135 libras, entonces la báscula no es válida.

Lo mismo puede decirse de las evaluaciones utilizadas en el aula. Si una evaluación tiene la intención de medir el rendimiento y la capacidad en un área temática en particular, pero luego mide conceptos que no están relacionados en absoluto, la evaluación no es válida.

Factores que impactan la validez

Antes de discutir cómo se mide la validez y diferenciar entre los diferentes tipos de validez, es importante comprender cómo los factores externos e internos impactan en la validez.

La capacidad de lectura de un estudiante puede tener un impacto en la validez de una evaluación. Por ejemplo, si un estudiante tiene dificultades para comprender lo que hace una pregunta, una prueba no será una evaluación precisa de lo que el estudiante realmente sabe sobre un tema. Los educadores deben asegurarse de que una evaluación se encuentre en el nivel de lectura correcto del estudiante.

La autoeficacia del estudiante también puede afectar la validez de una evaluación. Si los estudiantes tienen baja autoeficacia o creencias sobre sus habilidades en el área en particular en la que se les está evaluando, normalmente tendrán un rendimiento más bajo. Sus propias dudas obstaculizan su capacidad para demostrar con precisión el conocimiento y la comprensión.

El nivel de ansiedad ante los exámenes del estudiante también es un factor a tener en cuenta. Los estudiantes con alta ansiedad ante los exámenes tendrán un desempeño inferior debido a factores emocionales y fisiológicos, como malestar estomacal, sudoración y aumento de la frecuencia cardíaca, lo que conduce a una tergiversación del conocimiento del estudiante.

Medida de validez

La validez se mide mediante un coeficiente. Normalmente, se calculan dos puntuaciones de dos evaluaciones o medidas para determinar un número entre 0 y 1. Los coeficientes más altos indican una mayor validez. Generalmente, las evaluaciones con un coeficiente de .60 o más se consideran aceptables o altamente válidas.

Tipos de validez

Hay tres tipos de validez que debemos considerar: validez de contenido, predictiva y de constructo. La validez de contenido se refiere al grado en que una evaluación representa todas las facetas de las tareas dentro del dominio que se evalúa. La validez de contenido responde a la pregunta: ¿La evaluación cubre una muestra representativa del contenido que debe evaluarse?

Por ejemplo, si les dio a sus estudiantes un examen acumulativo de fin de año, pero el examen solo cubrió el material presentado en las últimas tres semanas de clase, el examen tendría una validez de contenido baja. El material del semestre completo no estaría representado en el examen.

Los educadores deben esforzarse por lograr una alta validez de contenido, especialmente con fines de evaluación sumativa. Las evaluaciones sumativas se utilizan para determinar el conocimiento que los estudiantes han adquirido durante un período de tiempo específico.

La validez del contenido aumenta cuando las evaluaciones requieren que los estudiantes aprovechen tanto como sea posible su aprendizaje en el aula.

El siguiente tipo de validez es la validez predictiva , que se refiere a la medida en que una puntuación en una evaluación predice el desempeño futuro.

Las pruebas de capacidad con referencia a normas, como SAT, GRE o WISC (Escala de inteligencia de Wechsler para niños), se utilizan para predecir el éxito en ciertos dominios en un momento posterior. El SAT y el GRE se utilizan para predecir el éxito en la educación superior. Estas pruebas comparan el desempeño individual de los estudiantes con el desempeño de una muestra normativa.

Para determinar la capacidad predictiva de una evaluación, las empresas, como el College Board, a menudo administran una prueba a un grupo de personas y, unos años o meses después, medirán el éxito o la competencia del mismo grupo en el comportamiento que se está estudiando. predicho. Luego se calcula un coeficiente de validez, y los coeficientes más altos indican una mayor validez predictiva.

El último tipo de validez que discutiremos es la validez de constructo . Para comprender la validez de constructo, primero debemos definir el término constructo. En psicología, un constructo se refiere a un rasgo interno que no se puede observar directamente pero que debe inferirse de un comportamiento constante observado en las personas. La autoestima, la inteligencia y la motivación son ejemplos de una construcción.

La validez de constructo , entonces, se refiere al grado en que una evaluación mide con precisión el constructo. Esto responde a la pregunta de: ¿estamos realmente midiendo lo que creemos que estamos midiendo?

La relación entre validez y confiabilidad

La confiabilidad , que se trata en otra lección, se refiere al grado en que una evaluación produce información consistente sobre el conocimiento, las habilidades o las habilidades que se evalúan. Una evaluación se considera confiable si se obtienen los mismos resultados cada vez que se administra la prueba.

Es importante comprender la relación entre confiabilidad y validez. Una evaluación puede ser confiable pero no válida.

Volvamos a nuestro ejemplo original. Si se pesa en una báscula, la báscula debería darle una medida precisa de su peso. Si la báscula le dice que pesa 150 libras cada vez que la pisa, es confiable. Sin embargo, si realmente pesa 135 libras, entonces la báscula no es válida.

Resumen de la lección

En resumen, la validez es la medida en que una evaluación mide con precisión lo que se pretende medir. La validez se ve afectada por varios factores, incluida la capacidad de lectura, la autoeficacia y el nivel de ansiedad ante los exámenes. La validez se mide a través de un coeficiente, con una validez alta más cercana a 1 y una validez baja más cercana a 0. Los tres tipos de validez a efectos de evaluación son la validez de contenido, predictiva y de constructo.

Objetivos de la lección

Después de ver esta lección, debería poder:

  • Definir ‘validez’ en términos de evaluaciones
  • Enumere los factores internos y externos asociados con la validez.
  • Describir cómo se utilizan los coeficientes para medir la validez.
  • Explicar los tres tipos de validez: contenido, constructo y predictivo.

¡Puntúa este artículo!