¿Qué significa “Evaluar”?
¿Se ha mantenido siempre el mismo concepto? ¿Cuál es la evolución histórica del
concepto? ¿Cuáles han sido los paradigmas en las distintas etapas?
Conforme la literatura académica, las raíces de la práctica
de la evaluación se remontan a los orígenes de la historia de la humanidad. El hombre
de Neanderthal ya la practicaba, al determinar los tipos de madera que servían
para la confección de las mejores lanzas. Las primeras evaluaciones formales
son evidentes aproximadamente en el año 2000 A.C., cuando las autoridades
chinas evaluaban el desempeño de los servidores públicos. Igualmente, los
griegos, siglos antes de Cristo, utilizaron mecanismos de selección de individuos
para el servicio público ateniense.
Sin embargo, la evaluación comenzó a ser practicada de
manera más estructurada y constante a partir del siglo XVIII, especialmente en
Francia y en la antigua
Prusia (Alemania), período en que comenzaron aplicarse
exámenes públicos en larga escala para la selección de empleados públicos. Tal
fue la importancia de los exámenes y de las pruebas que acabaron construyendo
un campo de estudios, la docimología, la «ciencia del estudio sistemático de
los exámenes, en particular del sistema de atribución de notas».
El gran paso para la evolución de la evaluación educativa
fue dado por Thorndike, a principios del siglo XX, cuando gana fuerza el
movimiento por pruebas en el área de la educación en la medida en que la
tecnología de la medición hacía rápidos avances. Thorndike desarrolló todo un
aparato tecnológico para medir las capacidades humanas, por lo que pasó la
evaluación a tener el significado de medida (testing). Así, a partir de 1920 se
vio un rápido surgimiento de pruebas basadas en la forma de programas, creados
para evaluar los grados individuales de desempeño.
Según Depresbiteris y Tavares, la idea de evaluación educacional,
en los Estados Unidos del siglo XIX, estaba tan vinculada a la idea de los
exámenes que fueron creadas diversas asociaciones para el desarrollo de pruebas
estandarizadas. La inspiración para esa concepción, que pruebas bien
construidas permitirían medir con rigor y neutralidad los aprendizajes
escolares de los alumnos, viene, de acuerdo a Fernandes, de las pruebas
destinadas a medir la inteligencia y las capacidades. Las pruebas psicológicas,
desarrolladas en Francia por Alfred Binet y Théodore Simón en 1905, dieron
origen al llamado coeficiente de inteligencia. En el Brasil, la sistematización
de los exámenes escolares fue hecha en los siglos XVI y XVII por los jesuitas,
por medio del documento conocido como Ratio
Studiorum, en el cual algunos de los procedimientos propuestos para el
momento de la prueba eran la rigurosidad con el tiempo para realizarla y el
silencio de los alumnos, quienes no podían preguntar nada.
Es solamente después de 1930, debido a los estudios de Ralph
Tyler, que la evaluación ganó mayor amplitud, y dejó de abordar el desempeño
individual o colectivo de los estudiantes para enfocarse en si los currículos y
las prácticas pedagógicas estaban alcanzando sus objetivos. Con Tyler surgió,
en 1934, la expresión «evaluación educacional» y es reconocido como el padre de
ese campo de estudio.
En su obra, Principios Básicos del Currículo, publicada en
1949, Tyler destacaba la importancia de la evaluación para el desarrollo del
currículo y consideraba que el proceso de evaluación consistía en determinar en
qué medida los objetivos educacionales estaban siendo realmente alcanzados por el
programa y el currículo.
La propuesta de evaluación elaborada por Tyler encontró
aceptación en los años 60 en el medio académico norteamericano y fue diseminada
por autores como Hilda Taba, quien en 1962, a partir de las ideas de Tyler,
propuso un modelo para elaborar el currículo. Por su parte, en 1962, Robert F.
Mager introdujo un modelo específico para la operacionalización de los
objetivos educacionales. Asimismo, James Popham junto a Eva Baker publicaron,
en 1970, un conjunto de cinco volúmenes centrados en el planeamiento de la
enseñanza y la evaluación.
Fueron cuatro autores norteamericanos los que contribuyeron
decisivamente, en la década de los años 70, para el desarrollo teórico del área
de la Evaluación
Educacional: Cronbach, Scriven, Stufflebeam y Stake. Los
estudios de esos autores, sumados a los de Parllet y Hamilton y los de
MacDonald, ejercieron una fuerte influencia en la trayectoria brasileña de la evaluación. Se debe
mencionar que, a partir de 1970, la evaluación educacional se convirtió en un
campo profesional definido, que exigía una especialización más profunda. En
este período, surgieron importantes revistas especializadas que permitieron la
difusión de nuevas ideas y la formulación de nuevas teorías y modelos, sobre
todo, la divulgación de estudios de base científica.
Cronbach propuso la superación de la idea de que los
objetivos son los estructuradores de la evaluación, la que debería ser
definida, en su aspecto más amplio, como «actividad diversificada que exige la
toma de varios tipos de decisión y el uso de gran número de informaciones». En
la visión de Cronbach, la evaluación (de programas, currículo o curso) debería
ser procesada a lo largo de su estructuración y no solo después, en su
conclusión.
Scriven consideraba que, aparte de evaluar los objetivos
finales de un curso, sería importante analizar aquellos que estaban en
desarrollo, lo que permitiría la intervención durante la ejecución del plan. Es
así como este autor trabajó los conceptos de evaluación sumativa y formativa.
Entendiéndose por sumativa a la evaluación realizada después de terminado un
proceso, con el objetivo de verificar los resultados y, por formativa, a la
evaluación realizada a lo largo del proceso con el objetivo de permitir el perfeccionamiento
de las acciones.
Stufflebeam también abrazó la concepción elaborada por
Cronbach y Scriven, en el sentido de entender la evaluación como toma de
decisiones. Para Stufflebeam la evaluación es un juicio de mérito que sirve
tanto para la toma de decisiones como para el control. Junto con Guba, Hammond
y Provus, elaboró el modelo de evaluación conocido como CIPP (Contexto, Input,
Proceso y Producto). La evaluación debería ser no solo para comprobar el valor
de los programas, sino también para mejorarlos.
Stake amplió la forma de interpretación de la evaluación
partiendo del principio de que la participación es fundamental y que toda
información debe ser llevada en consideración. Con eso la evaluación abarca la
emisión de juicio de valor no solo de los especialistas en evaluación, sino
también de todos los involucrados en el proceso evaluativo. Para Stake, lo
importante es lo que está sucediendo en el programa, por ese motivo su
concepción de evaluación está direccionada más para las actividades del
programa que para sus objetivos.
En la década de los años 70, Parlett y Hamilton
desarrollaron la llamada evaluación iluminativa basada en el paradigma socio antropológico
que buscaba una comprensión de la realidad mediante el estudio de los fenómenos
que ocurrían naturalmente. El foco estaba en la interpretación del proceso
educativo (experiencias de los participantes, los procedimientos institucionales
y los problemas gerenciales), llevando a discusión los resultados de la
evaluación como proceso.
Macdonald introdujo, en una clasificación política de los
estudios evaluativos, describió tres tipos: el burocrático, el autocrático y el
democrático. La evaluación burocrática constituye un servicio ofrecido a las
agencias gubernamentales con el objetivo de atender a las necesidades de mayor
control sobre la distribución de los recursos del área de la educación. La
evaluación autocrática, también, es un servicio ofrecido a las agencias
gubernamentales con el objetivo de mayor control sobre las políticas educativas
como un todo. Finalmente, la evaluación democrática es un servicio informativo,
ofrecido a la comunidad acerca de las características de un programa
educacional.
Con el objetivo de sistematizar el desarrollo histórico de
la evaluación educacional, Dias Sobrinho, autor brasileño, apoyado en el
trabajo de Stufflebeam y Skinkfield, destacó cinco periodos: el primero es
conocido como «pre-Tyler», situado en los últimos años del siglo xix y las
primeras tres décadas del siglo xx. El segundo, llamado de evaluación por
objetivos, tiene a Tyler como su mayor exponente situado) entre 1930 y 1945. El
tercero es designado «la era de la inocencia», que va de 1946 a 1957. El
cuarto, denominado «realismo», va de 1958 a 1972. El quinto, y último, es
conocido como «período del profesionalismo», que tiene como marco la década de
1970.
Otros autores brasileños, trabajaban con la propuesta de Guba
y Lincoln y destacan que la evaluación pasó por cuatro generaciones: la
primera, llamada de «medición», donde el énfasis es para las medidas y pruebas;
la segunda, llamada de «descripción», centrada en los resultados con relación a
los objetivos; la tercera llamada «juicio de valor», en la que le corresponde
al evaluador el papel de juez. Finalmente, la cuarta generación llamada de
«negociación», donde los parámetros y decisiones son determinados y definidos
por un proceso negociado e interactivo con los actores involucrados en la
evaluación.
Tomando en consideración las clasificaciones, anteriormente
mencionadas, se puede afirmar que el concepto de evaluación ha sido
comprendido, y todavía lo es, a partir de cuatro principales significados:
a) Evaluación y medida son sinónimos y se reducen a la
aplicación de pruebas.
b) La evaluación no se limita a medir, es mucho más que eso,
en la medida en que describe de forma neutral hasta qué punto los alumnos
alcanzan los objetivos definidos.
c) La evaluación es vista como un proceso en el cual no solo
se describe el desempeño alcanzado, sino también se juzga el desempeño del
alumno a partir de los objetivos educacionales propuestos.
d) La evaluación implica un proceso negociado e interactivo
con aquellos actores que están involucrados en el proceso evaluativo.
A partir de lo expuesto, se puede concluir que la evaluación
educacional, inicialmente preocupada por la evaluación del
aprendizaje/rendimiento escolar mediante la aplicación de pruebas
estandarizadas, confundida con medidas e inserta en el campo de la psicología,
pasó a preocuparse por los currículos, programas y, sobre todo, a tener como
referencia el cumplimiento de los objetivos. De estar muy restringida a los
alumnos, la evaluación se amplió para instituciones y sistemas, y hoy se
constituye en una «industria tentacular y sólidamente profesionalizada».
Extraído de
La evaluación educacional en el Brasil: de la transferencia
cultural a la evaluación emancipadora
Adolfo Ignacio Calderón
Regilson Maciel Borges
En; Educación Vol. XXII, N° 42, marzo 2013, pp. 77-95 / ISSN
1019-9403