Evaluación Escolar: Ventajas y desventajas de los diferentes enfoques con respecto a la evaluación docente

La evaluación del docente es tan imprescindible como controversial ¿Tiene sentido usar los aprendizajes de los alumnos como un indicador? ¿Qué importancia debe otorgarse a esta dimensión? ¿Qué críticas se hacen a esta forma de evaluar? ¿Están las evaluaciones estandarizadas pensadas para evaluar al docente?

El primer aspecto controvertido es si deberían utilizarse los indicadores de rendimiento escolar como una medida del desempeño de los docentes. El segundo punto de debate ilustra que las ventajas y desventajas de los diferentes métodos generalmente están relacionadas con los propósitos planteados para la evaluación docente y que, dadas las usuales restricciones de recursos, es inevitable realizar compensaciones entre los argumentos en favor de enfoques sumativos y aquellos en favor de sistemas formativos. Finalmente, los argumentos en favor o en contra de los diferentes enfoques reflejan las diferentes perspectivas de los actores, las que se traducen en dificultades de implementación.

Ventajas y desventajas del uso de los indicadores de rendimiento escolar como medida del desempeño docente

Los indicadores de rendimiento escolar constituyen una atractiva medida para evaluar el desempeño docente, puesto que el objetivo final de la enseñanza es el mejoramiento del aprendizaje de los estudiantes. No es de sorprender que gran parte de las investigaciones se hayan centrado en el uso del rendimiento académico de los estudiantes medido a través de las pruebas estandarizadas para evaluar a los docentes.

Por ejemplo, Leigh examinó recientemente los resultados de las pruebas de alfabetización y conocimientos básicos de matemáticas de tres cohortes de estudiantes y concluyó que las variaciones en las posiciones relativas de las clases de estudiantes proporcionaban una base para la identificación de los maestros eficientes e ineficientes. Braun sostiene que la consideración de los resultados de los estudiantes es un enfoque prometedor por dos razones: en primer lugar, traslada el debate acerca de la calidad de los docentes hacia el aprendizaje de los estudiantes como el principal objetivo de la enseñanza y, en segundo lugar, incorpora una medida cuantitativa –y, por ende, objetiva y equitativa– del desempeño de los docentes. A este respecto, el desarrollo de modelos de “valor agregado” representa un significativo avance en relación con los métodos basados en la proporción absoluta de estudiantes que logran un nivel de rendimiento determinado. Los modelos basados en el “valor agregado” tienen por objetivo controlar los puntajes anteriores obtenidos en las pruebas por cada uno de los estudiantes y, por lo tanto, tienen la potencialidad de identificar el aporte de un maestro particular al rendimiento académico de los estudiantes.

En Florida, el esquema denominado “Los Maestros Especiales reciben una Retribución” vincula la remuneración o las bonificaciones para maestros particulares a medidas de valor agregado del aprendizaje de los estudiantes. Sin embargo, este tipo de vínculo entre una medida de desempeño directa y la remuneración sigue siendo extremadamente escaso, dados los numerosos desafíos estadísticos y teóricos asociados al uso de estos métodos. En efecto, Braun recalca el marcado contraste entre el entusiasmo de quienes quisieran utilizar tales mediciones, principalmente las autoridades a cargo de las políticas, y las reservas expresadas por los investigadores que han estudiado sus características técnicas.

El uso del rendimiento académico de los estudiantes en las pruebas estandarizadas para evaluar el desempeño de los docentes plantea numerosos desafíos estadísticos. La mayoría de los autores no están convencidos de que la generación actual de modelos de valor agregado sea lo suficientemente válida y confiable como para ser utilizada para evaluar en forma equitativa la eficiencia de maestros particulares. Las limitaciones estadísticas están relacionadas, en primer lugar, con la notoria ausencia de datos confiables, principalmente debido al hecho de que los estudiantes no suelen rendir pruebas estandarizadas con una frecuencia anual. Rowley e Ingvarson critican la metodología de Leigh, que consiste en crear un puntaje de prueba hipotético en el año con datos faltantes en el punto medio de dos resultados disponibles, argumentando que no permite atribuir en forma equitativa el éxito de los estudiantes a los diferentes maestros involucrados. En segundo lugar, cuando se dispone de datos, las variaciones del muestreo pueden provocar imprecisiones en las medidas de los puntajes de las pruebas. Este problema es particularmente notorio en las escuelas básicas, donde el limitado número de estudiantes por clase genera grandes idiosincrasias de la muestra particular de estudiantes que está siendo evaluada.

Las principales críticas metodológicas señalan que los modelos basados en el valor agregado, cualquiera sea su grado de sofisticación, no pueden ni integrar cabalmente todos los factores que influyen en los resultados obtenidos por los estudiantes en las pruebas –de naturaleza cualitativa– ni reflejar todos los resultados de aprendizaje de los estudiantes. Los antecedentes y el apoyo de las familias, la asistencia a la escuela, el clima entre pares y en el aula, las políticas de las escuelas, la disponibilidad de materiales apropiados y los efectos de los niños influyen en el aprendizaje de los estudiantes. Factores específicos que intervienen en el momento de la prueba –“un perro que ladra en el patio, una temporada con una alta incidencia de resfríos, un estudiante con mal comportamiento en una clase”– también pueden afectar los resultados de un estudiante independientemente del aporte de su maestro. Además, es probable que los buenos maestros tengan un impacto en el rendimiento de los niños durante varios años después de haberles enseñado y, a la inversa, después de varios años de estar sometidos a maestros ineficientes, puede que los estudiantes nunca sean capaces de ponerse al día académicamente. Estos ‘efectos acumulativos’ de los docentes no pueden medirse con precisión en puntos discretos en el tiempo. Finalmente, el impacto de la enseñanza en los estudiantes no está restringido a las áreas evaluadas a través de las pruebas estandarizadas, generalmente limitadas a lectura y matemáticas, sino que también incluyen la transferencia de habilidades psicológicas, cívicas y de aprendizaje para toda la vida. Xin, Xu y Tatsuoka intentaron descomponer los puntajes de pruebas estandarizadas en diversas categorías de habilidades cognitivas en cuatro países (Japón, Corea, Holanda y Estados Unidos) y encontraron que los atributos de los maestros considerados en las decisiones con respecto a las remuneraciones no tienen un impacto positivo consistente sobre ningún tipo de habilidad cognitiva, a pesar de haber controlado los antecedentes tanto individuales como familiares. Estas son fuentes de escepticismo con respecto al uso de estos métodos estadísticos.

También es necesario considerar las limitaciones teóricas. En primer lugar, una correlación estadística no es una relación causal: el hecho de que los docentes sean importantes para el aprendizaje de los estudiantes no indica necesariamente que el aprendizaje de los estudiantes sea el resultado de una buena enseñanza. En segundo lugar, las pruebas estandarizadas utilizadas para evaluar a los estudiantes no están específicamente diseñadas para efectos de evaluar a los docentes. Siguiendo a Popham, Goe sostiene que no están diseñadas para ser particularmente sensibles a pequeñas variaciones en la pedagogía o para determinar los aportes de los docentes al aprendizaje de los estudiantes. En consecuencia, no ofrecen una base sólida que permita responsabilizar a los docentes por los resultados de su desempeño. En tercer lugar, el uso de los puntajes obtenidos por los estudiantes en las pruebas para evaluar a los docentes podría inducir distorsiones y constricciones no esperadas en el comportamiento de los docentes, centrándose solo en el rendimiento de los estudiantes en las pruebas estandarizadas. Los esquemas de incentivos de altas consecuencias (highstakes) basados en las pruebas estandarizadas pueden incitar a los docentes a concentrarse exclusivamente en las áreas pedagógicas evaluadas en las pruebas, reduciendo así el currículo a las habilidades básicas generalmente evaluadas, incitar a los maestros a concentrarse en los estudiantes específicos que están cerca de la nota de aprobación a expensas de los niños que están más atrasados o adelantados e incluso provocar graves casos de engaño por parte de los docentes en las pruebas estandarizadas. Por otra parte, puede que los resultados de las pruebas permitan identificar a los maestros que son ineficientes o requieren perfeccionamiento, pero no permiten ni discriminar en forma justa entre la amplia gama de maestros eficientes ni identificar cuáles son las actividades de perfeccionamiento que deberían implementarse con el fin de mejorar el desempeño de los maestros ineficientes. Finalmente, estos sistemas podrían traducirse en que los maestros fuesen responsabilizados por todo el desempeño de los estudiantes mientras que, por el contrario, se debería reconocer que la enseñanza exitosa es una responsabilidad compartida entre los gobiernos, las escuelas y la profesión docente.

Como consecuencia, a pesar del atractivo de la idea, existen numerosas advertencias contra el uso de los puntajes obtenidos por los estudiantes en las pruebas para evaluar a los docentes. En particular, existe un amplio consenso en la literatura en torno a dos direcciones específicas: los resultados de los estudiantes no deberían utilizarse como la única medida del desempeño de los docentes y no deberían utilizarse ingenuamente para la toma de decisiones relativas a la carrera profesional de un docente, incluyendo el vínculo con la remuneración, debido a que esto incorpora un considerable riesgo de castigar o retribuir a los docentes por resultados que están fuera de su control. Estas objeciones de los docentes y los investigadores se han materializado, por ejemplo, en la decisión de la legislatura del Estado de Nueva York de prohibir el uso de los resultados obtenidos por los estudiantes en las pruebas para evaluar a los maestros en abril de 2008.

Extraído de:

Evaluación docente: Prácticas vigentes en los países de la OCDE y una revisión de la literatura

Programa de Promoción de la Reforma Educativa en América Latina y el Caribe

Este informe fue preparado por Marlène Isoré

Marzo 2010

ISSN: 0718-6002

domingo, 2 de noviembre de 2014

Ventajas y desventajas de los diferentes enfoques con respecto a la evaluación docente

No hay comentarios:

Busca en mis blogs