viernes, 23 de julio de 2010

Hacia un paradigma analógico de la evaluación docente


Hacia un paradigma analógico de la evaluación docente
LUIS ANTONIO MONZÓN LAURENCIO
Academia de Arte y Patrimonio Cultural, Universidad Autónoma de la Ciudad de México
Introducción
Que la evaluación del desempeño docente no funciona en su forma actual en muchos países, entre ellos México, parece una afirmación tan evidente que cuesta trabajo creer que se sigan aplicando y tomando decisiones con base en sus resultados. Sin embargo, la información que deberían proporcionar estas evaluaciones resulta indispensable para ayudar a orientar las políticas educativas. Sin ella, es imposible determinar en qué medida los éxitos de la educación se deben al trabajo dedicado de los docentes y no, por ejemplo, a la intervención de los padres, de los medios o a la autogestión del estudiante. Es decir, la evaluación docente nos dice, a fin de cuentas, si es en realidad el docente el que está educando o si la falta de educación se debe a él. Sin embargo, en la actualidad, la información que nos brindan estas pruebas es insuficiente para determinar el valor real del trabajo de un profesor y tal indeterminación impide el diseño de estrategias adecuadas de mejora del personal docente. En el presente artículo sostendré la tesis de que esta ineficiencia evaluativa deriva, en gran medida, de la inscripción de este tipo de prácticas a un paradigma que no es capaz de brindarnos información relevante sobre este aspecto de la realidad. Siguiendo las tesis del filósofo mexicano Mauricio Beuchot, tal paradigma será llamado univocista,. Este paradigma ha sido fuertemente rebatido durante el siglo XX, dando pie a propuestas que se colocan al otro lado del espectro, es decir, en un paradigma que llamaremos equivocista, desde el cual postularíamos (en su versión más extrema) que cualquier evaluación de este tipo es imposible. Para solucionar la situación propondremos la necesidad de mudar esta práctica hacia un paradigma que llamaremos analógico, y que se coloca en medio de ambos paradigmas extremos, con la finalidad de lograr una mejor comprensión de la labor docente a fin de evaluarla con mayor exactitud; aceptando, sin embargo, que nunca lograremos un conocimiento absoluto de esta realidad. Por último, presentaré, lacónicamente, algunas consideraciones prácticas, derivadas del análisis teórico, que podrían ayudar a mejorar estos sistemas de evaluación docente. Tal vez las propuestas no sean del todo novedosas como tales, sin embargo, el aporte de las siguientes líneas radica en la justificación de las mismas en el pensamiento hermenéutico.

Hacia un paradigma analógico de la evaluación docente


La hermenéutica
Hablar de hermenéutica filosófica, hoy en día, es hablar de una de las dos vertientes más importantes de la filosofía, siendo la otra la filosofía analítica, quien ocupa también, todavía, un lugar predominante en el pensamiento contemporáneo. Sin embargo, también es hablar de una variedad de enfoques metodológicos diversos que se agrupan por semejanzas más o menos bien delimitadas. Como lo expresa Jean Grondin (2002): «bajo el término hermenéutica se resumen diversos enfoques, como la filosofía de Gadamer mismo, la rehabilitación de la filosofía práctica, emprendida bajo su influencia (H. Arendt, J. Ritter, M. Riedel, R. Bubner y otros) y que a menudo llamó la atención bajo la denominación de “neoaristotelismo”, la corriente historizante y relativizadora dentro de la teoría de la ciencia (Kuhn, Feyerabend) y dentro de la filosofía del lenguaje (Rorty, Davidson), pero también el posmodernismo de la vanguardia neoestructuralista cercana a Nietzsche» (p. 30). Sin embargo, también fuera del ámbito de la filosofía, la hermenéutica o paradigma interpretativo se ha vuelto un lugar común en las ciencias sociales. Rebeca Mejía Arauz (1998), comenta: «entendemos al paradigma interpretativo como un amplio espectro metodológico que abarca diversos enfoques investigativos, que coinciden de manera sustancial en la interpretación como elemento fundamental del análisis de la realidad social» (p. 14). Es la sociología la primera en iniciar la transformación hermenéutica, mediante la sociología comprensiva de Max Weber (2008). La antropología cultural tuvo que esperar propiamente hasta la llegada de Clifford Geertz (2003) para postular formalmente una antropología simbólica, aunque es verdad que en los años 20 el interaccionismo simbólico ya incluía el enfoque simbólico entre sus premisas. Sin embargo, es con Gadamer (2007) con quien podemos delimitar claramente lo que significa la transformación hermenéutica:
(…) el verdadero problema que plantean las ciencias del espíritu al pensamiento es que su esencia no queda correctamente aprendida si se las mide según el patrón del conocimiento progresivo de leyes. La experiencia del mundo sociohistórico no se eleva a ciencia por el procedimiento inductivo de las ciencias naturales. (…) Lo individual no se limita a servir de confirmación a una legalidad a partir de la cual pudieran en sentido práctico hacerse predicciones. Su idea es más bien comprender el fenómeno mismo en su concreción histórica y única. Por mucho que opere en esto la experiencia general, el objetivo no es confirmar y ampliar las experiencias generales para alcanzar el conocimiento de una ley del tipo de cómo se desarrollan los hombres, los pueblos, los estados, sino comprender cómo es tal hombre, tal pueblo, tal estado, qué se ha hecho de él, o formulado muy generalmente, cómo ha podido ocurrir que sea así. (pp 32-33)

En este fragmento de la obra fundamental del pensamiento hermenéutico, Verdad y método, (las cursivas de la cita son mías), observamos en qué consiste la transformación hermenéutica: la preocupación, no por la formulación de leyes generales que expliquen los sucesos sociales como un caso particular (una instancia) de esa ley general, sino la preocupación por la comprensión (Verstehen) de lo particular en su particularidad misma. Esto es lo que nos da la pauta para considerar la hermenéutica como la herramienta adecuada para la comprensión de algo tan individual, tan particular, tan situado como lo es el trabajo del docente en tanto que docente. La evaluación del trabajo docente no puede instituirse como la búsqueda de la coincidencia de su actuar con base en un conjunto de normas generales de actuación que se suponen las acciones normales de un buen profesor. La evaluación docente debe buscar comprender en su contexto real las acciones que tal persona lleva a cabo con miras a la realización de objetivos que a su vez están situados en un contexto determinado.
Es así que por hermenéutica vamos a entender, en su sentido más general, el arte de interpretar, es decir, el arte de buscar la comprensión, pues «(...) el objetivo o finalidad del acto interpretativo es la comprensión (...) [que es] el resultado inmediato y hasta simultáneo de la contextualización» (Beuchot, 2002, p. 17). La propuesta hermenéutica buscará la contextualización del trabajo docente para lograr su comprensión y, por ende, su evaluación. En la actualidad, la hermenéutica no sólo se encarga de la interpretación de textos. Para ella, la acción también puede ser entendida como texto. Weber (2008), es el primero proponer un acercamiento hermenéutico para el estudio de la acción al proponer la sociología como «... una ciencia que pretende entender, interpretándola, la acción social para de esa manera explicarla causalmente en su desarrollo y efectos» (p. 5). La acción por sí misma no dice nada, lo que nos habla es su sentido. El estudio de las acciones, desde una perspectiva conductista, está enfocada en la acción por sí misma (conducta) y no en su sentido, de ahí que falle para lograr la comprensión de la misma y sólo logre su explicación. Sin embargo, la acción docente no puede ser evaluada sólo por su explicación, lo que importa más es el sentido de la acción pues este orienta no sólo la acción del docente, sino del estudiante quien, al comprender el sentido, comprenderá también el mundo que el profesor le presenta y logrará con ello una transformación en la persona. Enseñar matemática, por ejemplo, no sólo implica lograr que el estudiante entienda el algoritmo de resolución de un problema, sino que implica conducirlo a ver el mundo de determinada manera. Bruner nos dice, por ejemplo, que el aprendizaje debe llevar al estudiante a «usar las herramientas que utilizan los matemáticos para abordar problemas como aquellos que abordan los matemáticos, usar las herramientas que utilizan los historiadores para abordar problemas como aquellos que abordan los historiadores y así de manera sucesiva» (Good, T. y Brophy, J., 1995). No basta, pues, con que sepan matemáticas, sino que vean al mundo desde la perspectiva del matemático. Es necesario, pues, que compartan el sentido de la acción del docente.

La Hermenéutica Analógica
El surgimiento del pensamiento hermenéutico se da como respuesta y en abierta oposición al positivismo. Sin embargo, en ese proceso se llega, como normalmente sucede, al extremo opuesto. El pensamiento hermenéutico deriva en los postmodernismos extremos que postulan, básicamente, que si todo conocimiento es interpretación y está sujeto a condiciones sociales, históricas, políticas, etc., entonces no hay criterios universales de pensamiento ni de rectificación del mismo, por lo cual, toda interpretación es igualmente válida o, mejor dicho, igualmente arbitraria. Reflexionando sobre esto, el filósofo mexicano Mauricio Beuchot (2002, 2006 y 2007), nos propone una manera de concebir esta disputa u oposición junto con una postura que medie entre ellas. Si partimos de la idea de que todo conocimiento es interpretación, entonces también el positivismo es un tipo de interpretación (aunque los positivistas no estén dispuestos a aceptarlo), la cual busca ser unívoca y universal, es decir, postulan que hay una única manera válida para todos de interpretar la realidad, tanto natural como social; si bien aquí prácticamente se niega el acto interpretativo por sí mismo, bajo el supuesto hermenéutico de que todo conocimiento es interpretación, en realidad se trata, entonces, de una interpretación que pretende negar la interpretación (Beuchot, 2002). Bajo esta perspectiva, la interpretación de una acción debe ser siempre universal y necesaria, es decir, responder a leyes generales de tal manera que se la puede evaluar con base en esas reglas. Llamaremos, con Beuchot a este tipo de hermenéutica univocista, la cual está representada, entre otras posturas, por el positivismo, el conductismo y la metodología cuantitativa. En contraposición a ella, tenemos la hermenéutica equivocista, es decir, aquella que postula que, dado que nunca lograremos la interpretación única de la realidad, entonces toda interpretación es idéntica en valor. Paul Boghossian (2009), ha sistematizado formal y rigurosamente estas posturas que defienden lo que él denomina la tesis de la validez igual y, por supuesto, presenta una gran cantidad de argumentos en contra de esta postura difundida fuertemente en filosofía, sociología, pedagogía y, especialmente en antropología. Esta postura está representada, entre otras escuelas, por los postmodernismos, los relativismos y los constructivismos (social, epistemológico y pedagógico, sobre este último véase también Gaubeca, 2008). Ante la existencia de estas dos hermenéuticas extremas, Beuchot propone buscar una posición intermedia, la hermenéutica analógica, pues «si incorporamos la analogía a la hermenéutica, tendremos una hermenéutica más amplia que la puramente univocista y más estricta que la puramente equivocista» (Beuchot, 2006, p. 19), por lo que ésta media entre el univocismo y el equivocismo, aunque inclinándose un poco más del lado de este último «cuando decimos que en la analogía predomina la diferencia sobre la semejanza, queremos decir que en una hermenéutica analógica se puede privilegiar lo diferente sin perder la semejanza» (Beuchot, 2006, p. 30). La hermenéutica analógica postula que sí es verdad que existe una gran cantidad de interpretaciones y acepta que es imposible acceder a la interpretación única y adecuada de un símbolo (y por ello de toda realidad cultural como lo es la acción docente), pero también postula que no por esto toda interpretación es igualmente válida, por lo que se pueden distinguir entre niveles de verdad de una interpretación o al menos, entre niveles de plausibilidad o verosimilitud. De tal manera que tendríamos criterios suficientes para inclinarnos por una interpretación en lugar de por otra, y jerarquizar estas sin tener que aceptar que una es la correcta, la única, la verdadera, pero sí la mejor, la más plausible, la más adecuada. Así, no hay un valor único que podamos asignar a un evento, son muchos los que podemos asignar, pero hay valores mejor asignados que otros. Llevado a la evaluación, no hay una calificación única y absoluta que podamos asignar a un hecho, mas no por ello deja de ser posible determinar que una calificación está mejor asignada que otra1. Por último, hay que decir que la evaluación es interpretación. El evaluador, no sólo recoge datos (ésta es sólo la parte de la medición e incluso ésta es ya una interpretación), sino que interpreta esos datos (los evalúa, los valora) para determinar si satisfacen o no una norma. Sin interpretación no necesitaríamos evaluación porque los hechos nos hablarían por sí mismos, es decir, sabríamos que algo bueno es bueno porque se muestra como tal. Pero evaluamos porque no sabemos o no tenemos la certeza de si algo es como deseamos que sea o no. Entonces tenemos que interpretar sobre la base de ciertos criterios si algo está de acuerdo con ellos o no. Así, dado que la interpretación se da ahí en donde falta precisamente claridad, entonces quedará claro que la evaluación es interpretación. Esto es verdad incluso en la evaluación cuantitativa y conductista, porque los puros datos no bastan para emitir un juicio de valor sobre un objeto, dado que una misma asignación de calificaciones puede conducir a la aceptación de un objeto en una circunstancia y a su rechazo en otra. Hace falta comparar la calificación obtenida con una expectativa anterior, y esta comparación ya implica, aunque sea mínimamente, un acto interpretativo. Por ejemplo, el profesor que evalúa a un estudiante, interpreta sus respuestas y acciones (comportamiento, prácticas, tareas, etc.) para determinar si ellas demuestran o no que posee conocimientos, habilidades o actitudes determinadas de antemano. El evaluador docente (estudiante, directivo o autoridad Estatal), interpreta las acciones de este para determinar si cumple o no con ciertas expectativas y calificarlo, o sea, decir si es o no un buen docente.

El modelo de evaluación univocista: positivismo y conductismo
El modelo de evaluación univocista es aquél que considera que a una acción determinada correspondería una y sólo una calificación posible. Es decir, o se hacen las cosas conforme a la regla y en consecuencia la acción es correcta, o se hacen distinto a lo que marca la regla y son incorrectas. Vistas las cosas así, podemos dejar este tipo de evaluación en manos de una computadora. Pero ni ella ni los evaluadores univocistas valorarán adecuadamente a un docente si proceden así. El gran problema con los sistemas de evaluación, en México y otros países, es que están aún inscritos en este paradigma univocista, continúan aún pensando en términos cuantitativos y conductistas, aún y cuando se presentan como modelos novedosos. Por eso hablamos de paradigmas y no de modelos, porque se trata de ideas que sostienen los modelos de evaluación y no los modelos mismos. Así, un mismo modelo de evaluación puede utilizarse con fines univocistas, equivocistas o analógicos, tal como sucede con las técnicas de recolección de datos, como la entrevista, que puede ser cuantitativa o cualitativa. Lo que hay que cambiar es el paradigma, no sólo el modelo. El primer indicio de que esto es así nos lo brinda el que dichas evaluaciones tratan de determinarse mediante el uso de instrumentos con pretensiones objetivas tales como test de opción múltiple (generalmente aplicados a los estudiantes), listas de verificación de acciones del docente (¿escribió el tema en el pizarrón?, ¿llegó puntual a clase?, etc.), conteo de trabajos, asistencias, reportes, etc. Este tipo de acciones no están equivocadas, pero resultan insuficientes para brindar información relevante sobre el verdadero desempeño docente, porque ser un buen docente implica más que llevar a cabo determinadas acciones de manera sistemática (perspectiva conductista). El segundo indicio se nos presenta en la medida en que las pruebas pretenden ser universales y se aplican por igual a profesores de física, filosofía y arte, como si los propósitos, los fines, las estrategias y contenidos de estas asignaturas fuesen idénticos. Incluso algunas escuelas utilizan los mismos instrumentos para nivel medio superior, superior y posgrado en diversos planteles del país2. Como si las acciones docentes exitosas fuesen únicas e iguales en todo caso y contexto. Por eso son insuficientes, porque una
Se desprende de aquí que una política nacional de evaluación docente que pretenda medir el éxito del sistema de acuerdo a parámetros objetivos y universales, responde a la misma objeción.
Rápidamente observamos la aparición de los dos índices señalados, es una prueba conductista y por ello insuficiente: del hecho de que un profesor no explique el programa de estudios no se sigue que el éxito docente (es decir, que el estudiante aprenda) sea deficiente; como tampoco de la falta de uso de material didáctico ni de si revisa o no los resultados del examen frente a grupo. Podemos hacer todo eso y aún así ser un mal docente. Debe entenderse aquí que la objeción no es sobre la validez de estos métodos, sino sobre el hecho de que no hay una conexión unívoca e infalible entre la realización de estas acciones y el ser o no un buen docente. Por otro lado, la tendencia universalizadora, esta prueba se aplica por igual, en la universidad señalada, a niveles medio, superior y postgrado, en todos sus planteles (35 en todo México) y a todas las áreas de conocimiento (ingenierías y licenciaturas). ¿Se puede esperar que los profesores de Ética (en bachillerato) trabajen igual que los de Sistemas de Gestión de Calidad o los de Estructura Funcional del Sistema Músculo Esquelético en Medicina? Si un profesor de filosofía no genera un nivel académico en clase que invite a la reflexión y al análisis, es mucho peor que si el profesor de Estructura Funcional..., no lo hace. De igual manera, el material didáctico para medio superior tiene características distintas (o debería tenerlas) para docentes de medio y de posgrado, en donde el nivel de abstracción debe ser más alto. Por otro lado, para una correcta interpretación de los resultados3, hay datos que se deberían incluir: la asignatura, nivel, tema, etc. Además, por ejemplo, sólo se mencionan las medias de las calificaciones obtenidas. Esta evaluación se califica de 0 a 5, de tal manera que si tenemos una desviación estándar de, digamos, 0.1 o 0.2, los resultados de la evaluación serían muy confiables, pues las opiniones son más o menos estándar. Pero si la desviación supera 2.0 o llega a 2.54, la confiabilidad de la prueba es prácticamente nula. Como este dato no está en el reporte, no se puede llegar a conclusiones contundentes, aunque de facto se haga y algunos profesores pierdan grupos, horas de clase y hasta el trabajo por ello.

Hay muchas más objeciones que hacer, pero el espacio es breve, así que las dejaré para otro momento. Sólo cabe señalar que en este instrumento nunca aparece la pregunta fundamental: ¿aprendiste? Es decir, ¿el profesor cumplió con la función principal y determinante por la cuál tú y él están aquí? Por supuesto, no quisiera generalizar inapropiadamente. Hay instituciones que ya están haciendo intentos de modificar esta situación, pero aún no son suficientes. Es por esto que afirmamos que no es que este tipo de evaluaciones estén equivocadas, sino que son insuficientes para medir un proceso real, profundamente humano y social que tiene que ver con una transformación profunda del individuo, pues la educación se refiere a «(…) aquellas acciones con las que los hombres intentan mejorar en algún aspecto y de forma duradera la estructura de las disposiciones psíquicas de otros hombres, o conservar sus componentes enjuiciados como valiosos o impedir la aparición de disposiciones que se consideran perniciosas» (Brezinka, 1990 p. 117). Es por esto que algunos críticos de la evaluación se van casi al extremo opuesto y han propuesto, si no la desaparición de todo sistema de evaluación, sí modificaciones que la convierten en un proceso que brinda menos información que la evaluación conductista. Sin embargo, postular que los métodos actuales de evaluación son inapropiados no implica de ninguna manera la conclusión de que debemos olvidarnos de ellos. Desde nuestra perspectiva analógica debemos considerar que la información de estos sistemas sí es importante, pero ha de concentrarnos no en lo que todos los profesores hacen igual, sino en lo que hacen distinto, en la diferencia, porque en la analogía «(…) se puede privilegiar lo diferente sin perder la semejanza» (Beuchot, 2006, p. 30).

La evaluación docente inscrita en el paradigma analógico
Como la evaluación, desde el paradigma univocista, busca la explicación de la conducta docente, en general, podemos afirmar que presenta los siguientes problemas: 1. 2. 3. Que es cuantitativa y conductista (se centra en acciones realizadas y no en la transformación del estudiante). Se da de manera unívoca del estudiante al docente o del director al docente, etc., por lo que no tiene un correlativo real. Es a corto plazo.

Del paradigma equivocista no nos ocuparemos por falta de espacio y porque, en su versión radical, la evaluación tiende a desaparecer o, en versiones menos radicales como las constructivistas, a transformarse tanto que en realidad deja de ser útil. Es así que para ayudar a mejorar la evaluación docente desde una perspectiva analógica se propone lo siguiente: 1. 2. 3. Uso de metodología cualitativa. Evaluación del estudiante en tanto que estudiante. Evaluación de trayectorias (largo plazo) y no de periodos (corto plazo)

Evaluación y métodos cualitativos
El objetivo de la evaluación docente desde la perspectiva analógica, apoyado en la tesis de Gadamer sobre la comprensión, no es determinar si un profesor concreto es un caso particular de una ley general (es decir, si su conducta se apega o no a ciertas reglas), su finalidad debe ser comprender cómo es tal profesor, en su concreción histórica y única y qué ha hecho con los estudiantes para que ellos sean ahora así como son. Para lograr esto, la evaluación docente debe dejar de ser cuantitativa, concentrada en conductas y preocuparse por comprender los procesos subjetivos que se llevan a acabo en el encuentro entre el docente y el estudiante. La inclusión de métodos cualitativos y técnicas como las entrevistas en profundidad podría aportar información más valiosa, pues no basta preguntarle al estudiante: «¿explicaba claramente los conceptos?», sino que debemos tratar de penetrar en los procesos de construcción subjetiva del aprendizaje para comprender en qué consistía esa claridad, para ponerla en contexto. Durante una entrevista, un estudiante mostraría no sólo si él cree que el profesor explicaba los conceptos, sino que podemos profundizar para ver si esas explicaciones dejaron huella en el estudiante. Esto también ayudaría, por ejemplo, a comprender que un estudiante resentido podría estarlo precisamente porque un profesor cumplió con su labor y fue el estudiante quien realmente no hizo su parte, pues no debemos olvidar, como hace la evaluación conductista, que el proceso educativo es trabajo de dos, pues si el estudiante no quiere aprender, no lo hará: «considerada desde el punto de vista de quien es educado, la intencionalidad es también una característica imprescindible del proceso educativo (…)» (García, 2002, p. 100). Por otra parte, el uso de la observación de clase, distinta de la supervisión de clase, también podría ayudar. La supervisión es conductista y trata de establecer si el docente lleva a cabo o no conductas determinadas. Pero la observación de clase implicaría que el evaluador trate de comprender por qué el profesor actúa de tal manera, qué sentido tienen sus acciones en ese contexto determinado y si ellas están generando cambios en los estudiantes reales del mismo contexto. Y no me refiero solo a interpretar las acciones de los profesores que utilizan métodos no ortodoxos, más bien las accione sospechosas deberían ser las «buenas» acciones, pues el evaluador debería preguntarse ¿el profesor hace esto para que realmente aprendan los estudiantes o sólo porque está escrito que debe hacerlo?

La evaluación de trabajo del estudiante en tanto que estudiante
La evaluación del trabajo docente debe indicar el resultado de un encuentro de subjetividades. Por ello, debe ser correlativa, esto es, del estudiante al docente y viceversa; debe reflejar una mutua comprensión. El paradigma univocista sólo enfatiza una de estas vías de evaluación. El modelo de evaluación docente conductista actual no tiene un correlativo real con respecto a la evaluación del estudiante. La evaluación que hacemos los profesores del trabajo de los estudiantes, asumiendo como hipótesis que es plenamente funcional, no refleja el trabajo del estudiante en tanto que estudiante, no busca comprender su comportamiento; mientras que el modelo de evaluación docente, asumiendo lo mismo, está diseñado para medir el trabajo del profesor en tanto que profesor.

No existen (al menos en México) modelos de evaluación del estudiante en tanto que estudiante lo cual convierte a la evaluación docente en un proceso unívoco y, por ende, incompleto. Hace falta un correlativo analógico de la evaluación docente. Es decir, que el profesor haga algo análogo al trabajo que hace el estudiante de calificar al docente qua docente, i. e., que el docente tenga la oportunidad de evaluar el desempeño del estudiante en tanto que estudiante. Así es que proponemos que los profesores, además de calificar los conocimientos y aprendizaje del estudiante, tengan la posibilidad de evaluar al estudiante en tanto que estudiante, sin que esto suponga un conductismo, no se trata de evaluar su conducta como estudiante, sino de comprenderla, y para ello es necesario, como ya dijimos, contextualizarla. Esta evaluación lo que busca es poner al estudiante en su contexto y evaluarlo con respecto a él. Además esto permitiría comprender (además de explicar) por qué un estudiante calificó de determinada manera a un profesor. Los datos obtenidos se pueden cruzar con las evaluaciones que hacen los estudiantes sobre los docentes para lograr una mejor comprensión. Así, por ejemplo, tendríamos cuatro posibles resultados en un cruce de información: 1. 2. 3. 4. Los resultados del docente son altos y los resultados del estudiante, también. Los resultados del docente son altos y los resultados del estudiante, no. Los resultados del docente son bajos y los resultados del estudiante, son altos. Los resultados del docente son bajos y los resultados del estudiante, también.

Estos resultados aún no nos brindan certeza absoluta, pero la comprensión mejora en casos como 3, pues observamos que «buenos estudiantes» afirman que su profesor no es bueno, lo cual puede ser más cierto que la afirmación de que el profesor es malo en el caso 4. Igualmente, la comprensión (contextualización) que se nos da en el caso 2, nos permite entender que un grupo de «malos» estudiantes reconocen que su profesor es bueno. Esta comprensión no se da cuando la evaluación es unívoca y sin correlativo. Si además hacemos esto a nivel individual, cruzando la calificación que otorga cada estudiante a cada profesor, podremos comprender que hay claros casos de estudiantes o profesores resentidos o con favoritismos. Esto se tratará en otro artículo.

Evaluación de largo plazo o largo alcance
Desde el paradigma univocista se hace una vinculación uno a uno entre desempeño docente y periodo escolar terminado. Pero la educación no concluye (o no debiera) con el periodo, se trata de una transformación permanente. Así, evaluar el desempeño de un docente con base en los resultados de su último trimestre, semestre, año u otro periodo, es insuficiente, pues no se es un buen o mal profesor por un periodo determinado, aunque podemos aceptar que tenemos mejores y peores momentos. La perspectiva que dan el tiempo y la maduración puede hacer que los datos que se arrojen sobre el desempeño de un docente sean más útiles. La calidad de un profesor no está unida unívocamente al desempeño de un periodo determinado. Lo que hace a un buen profesor se determinará mejor si se analiza su trayectoria y no sólo las conductas realizadas en un periodo. Para ello, la opinión de ex alumnos de periodos anteriores al último es tanto o más valiosa que esta última. Todos tenemos experiencias con docentes a los que no valoramos hasta tiempo después, pues sus acciones no eran comprendidas en el momento; se requirió de más experiencia, de la distancia temporal y de la maduración de experiencias pasadas para darle un lugar más justo a las acciones pasadas. Es por esto que muchos de nosotros reconocemos el valor de un profesor hasta que nos convertimos en uno. La evaluación docente, entonces, no debe estar concentrada en las acciones a corto plazo de los profesores. Se debe evaluar siempre y en cada momento su trayectoria. Un rápido ejemplo de esto sería aquél profesor que pese a tener durante cinco semestres consecutivos buenas calificaciones, porque en el último semestre salió bajo, es castigado y se le quitan grupos.

Conclusiones
Hemos visto que la hermenéutica es una perspectiva contemporánea que tiene algo que aportarnos para hablar del tema de la evaluación la cual es, a fin de cuentas, una interpretación que hacemos de algunos datos que tenemos. Siendo así, desde la perspectiva hermenéutica analógica de M. Beuchot, debemos oponernos a modelos de evaluación univocistas y equivocistas y buscar un modelo intermedio, analógico, de la evaluación docente. La postura analógica buscará una evaluación que atienda a principios generales, pero que se concentre en lo particular de cada caso, en lo concreto, en el obrar real y contextual del docente mismo, para así comprender su desempeño y no sólo explicarlo. Es por esto que hemos defendido la idea de que el modelo positivista-conductista de la evaluación actual es insuficiente (que no equivocado) para darnos información valiosa sobre el quehacer docente y, por ende, sería inapropiado sostener políticas educativas sobre estos datos. Necesitamos un modelo analógico que medie entre los puros datos cuantitativos y las meras experiencias subjetivas, poniendo énfasis en estas últimas. Porque no hay conductas determinadas que sean únicas y universales para determinar que alguien es un buen docente; además de que no pueden generalizarse estas conductas a diversos países, regiones de un país, escuelas, asignaturas ni temas. Habrá siempre buenos docentes que no obren de la manera determinada y docentes que se comporten «como se debe» y sean malos docentes. Una política nacional o internacional de evaluación docente que pretenda cualificar la calidad de los mismos con estándares universales está destinada necesariamente a cometer injusticias y, por ende, a fracasar. Tales políticas basadas en la evaluación docente (que no son todas, pero sí algunas importantes) deben sostenerse sobre la base de que es importante la similitud, pero más importantes las variaciones contextuales que se dan. Es por eso que hemos propuesto otros acercamientos más analógicos, que no olviden lo que hay de semejante, pero también contemplen lo que hay de particular en cada caso. Entre ellos, la evaluación basada en el método cualitativo, la evaluación correlativa del estudiante en tanto que estudiante y la evaluación de la trayectoria docente por encima de la evaluación de periodos. Con ello no se llegará aún a la certeza sobre la calidad del docente, pero nos aproximaremos más a ella, será más plausible, más verosímil, pues se trata de acciones sociales que difícilmente se pueden determinar con juicios verdaderos o falsos. Es decir, el enunciado: «A es un buen profesor» no puede ser verdadero o falso sin más, apenas puede ser más o menos plausible, verosímil, nunca exacto. Por ello, las políticas generales tienen que establecerse con cierto grado de incertidumbre, de flexibilidad y de autocorrección constante.

martes, 13 de julio de 2010

ESTÁNDARES O CRITERIOS E INDICADORES PARA LA EVALUACIÓN DE LOGROS

SISTEMAS DE DETERMINACIÓN Y EVALUACION DE METAS DE LOGROS DE APRENDIZAJE ESCOLAR COMO INSTRUMENTOS PARA MEJORAR LA CALIDAD, LA EQUIDAD Y LA RESPONSABILIZACION EN LOS PROCESOS EDUCATIVOS EN AMERICA
LATINA
LA SITUACION ACTUAL
Debe resaltarse también el hecho de que, salvo casos excepcionales, en los países de América Latina no se ha especificado, discutido y difundido cuáles son las expectativas de logro, ni cómo se habría de saber si un examinado ha aprendido lo que debe aprender. Esto, es decir, el hecho de no contar con criterios e indicadores de logros o estándares y el hecho de que muchas de las pruebas nacionales siguen estando referidas a normas (es decir, sólo sirven o debieran servir para comparar el logro de distintos grupos, y para analizar el impacto de diversos factores sobre el nivel de logros de esos distintos grupos, pero no para determinar cuánto del currículo intencional o del currículo implementado está siendo efectivamente dominado o aprendido por los escolares, ni cuán bien lo están haciendo) –o tienen un tipo “híbrido” del cual desconfían muchos especialistas– hacen difícil la interpretación correcta de los resultados de muchas de las pruebas de rendimiento escolar.

Reporte tras reporte o artículo de opinión pública informa que los alumnos de un país sólo dominan algo menos o algo más que la mitad de los conocimientos, capacidades, habilidades, destrezas o competencias que se esperaría hubieran desarrollado en un campo disciplinario general una vez alcanzado determinado nivel de su escolaridad, o que los alumnos de las escuelas públicas dominan incluso menos que esa mitad. Esa inferencia es, con frecuencia, ilegítima. La conclusión está predeterminada por la manera en que se construyen las pruebas referidas a normas: eliminando preguntas que en la etapa piloto resultaban muy difíciles o muy fáciles y que reducían la variabilidad en las respuestas, con lo cual no se podían hacer los análisis estadísticos acostumbrados para ese tipo de medición. Ni la cobertura del currículo, ni, con frecuencia, la cobertura de las muestras de estudiantes que son evaluados con ese tipo de pruebas permiten llegar válidamente a ese tipo de conclusión.

En lugar de poder decirnos solamente quiénes están mejores o peores que otros, que es casi todo lo que pruebas referidas a normas pueden contribuir a establecer, buenas pruebas elaboradas con referencia a criterios y estándares permitirían medir cuánto de lo que la sociedad espera que los escolares aprendan está efectivamente siendo aprendido, así como cuán bien está siendo aprendido. Idealmente, la definición de esas expectativas de logro o estándares de desempeño y niveles de ejecución debería hacerse con suficiente claridad y antelación al diseño y aplicación de las pruebas y con amplia participación de distintos grupos de actores sociales.

Los estándares educacionales definen las competencias y habilidades básicas que deberían adquirir los niños y jóvenes durante su tránsito por el sistema escolar. Definen y comunican con claridad a distintas audiencias, no sólo las especializadas, lo que los estudiantes deberían saber en cada área de conocimientos en cada grado o nivel y lo que deberían saber hacer con esos conocimientos, además de establecer cuán bien deberían poder hacerlo, conforme a una gradiente de desempeños basada tanto en lo deseable como en lo ya observable.


Se piensa que definir con claridad y elevar esos estándares contribuirá a mejorar los logros de aprendizaje de todos los alumnos, movilizando sus propios esfuerzos y los de todos los otros actores del sistema que inciden sobre sus logros. Sería más fácil que se dé ese tipo de movilización si tanto los estudiantes como sus padres y sus docentes supieran que se espera que, hacia el final del cuarto grado, por ejemplo, los alumnos sepan sumar y restar fracciones y sepan cómo aplicar esas operaciones para la resolución de problemas prácticos de su vida cotidiana, que sepan dar a otros instrucciones precisas para llegar a algún lugar conocido, sepan las diversas razones que indujeron a las colonias americanas a rebelarse contra la autoridad de sus gobernantes europeos y sus representantes locales y puedan expresar en sus propias palabras qué ganaron y qué perdieron ciertos grupos sociales con el cambio habido tras su independencia.

Las evaluaciones de rendimiento serían más fáciles de elaborar, tendrían más sentido y gozarían de mayor legitimidad si esos estándares fueran ampliamente conocidos y discutidos antes de su establecimiento “formal”, en los distintos ámbitos y niveles de gestión educativa. Es más, no se trata tan sólo de que ellos sean conocidos por actores de diversos sectores de la sociedad civil, sino que éstos y sus organizaciones (profesionales, escolares y ciudadanas) deben haber participado o quizás iniciado movimientos en pos de su establecimiento e implementación.

Nadie podría en rigor argumentar que en algún país latinoamericano existe ya un conjunto de estándares altos, estimulantes y legitimados entre amplios sectores de la sociedad o que son el marco de referencia principal para la elaboración del currículo, el diseño de textos y materiales, la formación de docentes y el mismo diseño de su sistema de evaluación.

Dicho lo cual, sin embargo, es conveniente anotar que en casi todos los procesos de reforma curricular en curso en los países de la región se ha expresado explícitamente la necesidad de arribar a consensos sobre qué metas y contenidos son deseables para su población y su sistema educativo7. Esas expresiones, sin embargo, muchas veces no han tenido como correlato la implementación de canales efectivos para la generación de dichos consensos. Aun cuando las iniciativas de reforma hayan tenido un origen político, sus procesos de validación se han limitado generalmente a acciones de carácter casi exclusivamente técnico. A diferencia de lo que ocurre con el movimiento en pos del establecimiento de estándares educacionales, particularmente en los Estados Unidos, el proceso de validación curricular y de sus indicadores de logros en América Latina suele darse sólo durante su elaboración inicial, mediante comisiones o grupos de trabajo especiales creados durante el lanzamiento de los programas y hasta el momento de su establecimiento legal o normativo, mientras que “los sindicatos docentes y asociaciones profesionales no se han constituido en agentes permanentes de promoción para la elaboración y renovación de contenidos, lo cual indica que la validación curricular es uno de los aspectos de las políticas educativas de la región que aún permanecen relativamente centralizados”. La validación y la consulta deberían
“consolidarse como proceso permanente, donde la sociedad civil y los diferentes actores del sistema educativo participen en forma dinámica y sostenida para garantizar la renovación y mejoramiento de los contenidos curriculares. Cabe recordar que esta validación es un proceso técnico, en tanto requiere de la participación de especialistas, a la vez que es político y democrático y que por lo tanto requiere de la participación de la sociedad toda en un diálogo donde estén representados los valores e intereses de todos los sectores de la población”1.

Sobre este último punto, sin embargo, es necesario tener conciencia de que puede haber un quid pro quo entre la necesidad y conveniencia de un consenso, tanto de la opinión pública como de la profesional, y la necesidad y conveniencia de la innovación. La necesidad de encontrar convergencias entre todas las partes efectiva o idealmente interesadas, es decir, entre profesores, padres, estudiantes, administradores, profesores universitarios, líderes empresariales y comunales y diseñadores de políticas puede entrar en tensión, si no conflicto, con el objetivo de lograr estándares óptimos. Un participante en uno de esos esfuerzos para establecer estándares en un estado norteamericano decía:
“Por un lado, si se suponía que estos estándares debían representar las banderas de la comunidad, entonces tenían que haber reflejado valores y propósitos compartidos. Por otro lado, si se deseaba el cambio, entonces estos estándares tenían que hacer algo más que reflejar las prácticas vigentes. Se necesitaban nuevas ideas, ideas que se alejaban de las prácticas y los supuestos vigentes… ”

Debido a lo anterior, los indicadores de logros y competencias curriculares –dejando de lado cuestiones técnicas que los alejan en mayor o menor grado de las definiciones ideales de lo que son o deben ser los estándares– carecen con frecuencia de la legitimidad y el consecuente compromiso social necesarios para movilizar y articular los esfuerzos de innovación y reforma tanto en lo pedagógico como en la gestión educativa, y para dar mayor sentido y consistencia a las evaluaciones.

La revisión de los currículos reformados, según también informa Ferrer, revela avances sustantivos respecto de los viejos listados de datos que debían adquirirse en el proceso de la escolaridad, la inclusión de consideraciones reflexivas sobre diversas necesidades de conocimientos y competencias para la vida en una sociedad moderna y compleja y especificaciones de contenidos mínimos a alcanzar. Pero, ya sea por el aún débil desarrollo de capacidades técnicas en las oficinas curriculares de muchos de nuestros países, por la falta de participación activa y efectiva de expertos externos al sistema escolar, o por el deseo de evitar los conflictos potenciales antes indicados, muchos de estos documentos curriculares no proveen aún parámetros de desempeño y rendimiento que puedan guiar con suficiente claridad los esfuerzos de evaluación. Tampoco parecen contener algo que es hasta más importante, metas altas y crecientes de competitividad y excelencia académicas (términos ya de por sí conflictivos en nuestros sistemas educacionales), comparables a las que explícitamente están persiguiendo las escuelas a las que asisten las elites nacionales y regionales y las que buscan alcanzar los sistemas educativos de otras regiones del mundo.

Desde esta perspectiva, debe llamarse la atención hacia la reciente experiencia de los Ministerios de Educación centroamericanos, quienes, convocados por la Secretaría General de la Coordinación Cultural y Educativa Centroamericana (CECC), acaban de publicar su propuesta de estándares nacionales y subregionales para la educación primaria en matemáticas, ciencias y lenguaje. Es indispensable que dicha experiencia se dé a conocer más allá de las bastante reducidas instancias técnicas y administrativas que hasta el momento han sido informadas al respecto. Debe asegurarse que se inicien en Centroamérica amplias discusiones nacionales, regionales y locales sobre los aprendizajes que las escuelas deben lograr que desarrollen sus alumnos y que el seguimiento y evaluación del proceso seguido para su desarrollo y eventual implementación puedan ser aprovechados por otros países y subregiones del continente.

ELEMENTOS (MÍNIMOS) DE LOS ESCENARIOS DESEABLES
Un movimiento hacia modelos operativos de sistemas escolares más efectivos requiere el establecimiento de consensos sociales amplios sobre los contenidos esenciales y las metas de aprendizaje y desempeño que todos los alumnos de un país, de una región del mismo, de un espacio geográfico determinado, o de un centro escolar en particular, deberían alcanzar gracias a su experiencia escolar. Requiere, por lo tanto, de una comprensión a nivel local de la conveniencia de la adopción de algunos estándares de carácter más universal –y canales para la participación de actores representativos de la diversidad de situaciones nacionales y locales en el establecimiento de esos estándares y de sus indicadores de logros–, a la vez que requiere de espacios para la inserción de expectativas y necesidades locales.

Un escenario deseable se caracterizaría por un intenso debate local, con participación de actores diversos que incluyen tanto a docentes como a otros líderes sociales, sobre el significado de esos estándares y por la elaboración de indicadores de logros basados en visiones realistas de las brechas de aprendizajes que distinguen los resultados de las escuelas “realmente existentes” de ideales más universales. Las escuelas, las localidades y los sistemas nacionales contarían con “estándares propios”, elaborados a la luz de miradas hacia fuera y hacia dentro de sus propios contextos y necesidades inmediatas.
En cualquier escenario deseable se habría establecido con claridad y con participación de toda la sociedad qué es lo que los alumnos de distintos ciclos de estudios deben saber y saber hacer (estándares), y cómo puede demostrarse y medirse que realmente han logrado esas metas de aprendizaje. Cómo es que cada escuela, docente o familia intenta lograrlas sería materia que debe determinar cada uno de ellos, pues no se trata de uniformizar la pedagogía, sino de asegurar resultados y búsqueda de logros siempre mayores.

Los estándares tienen la particularidad de “enganchar” bien con la mentalidad empresarial cuyas organizaciones se han convertido en muchos estados y localidades norteamericanas, por ejemplo, en los más vocales promotores de su establecimiento y utilización como ejes articuladores de los otros componentes de las reformas educativas. Esas organizaciones, así como otros grupos profesionales especializados, centros de investigación educacional, organizaciones gremiales de docentes, instituciones no gubernamentales de promoción de mejoramiento educativo y diversas alianzas de todos los anteriores, tomarían la iniciativa en la propuesta y formulación de estándares y métodos de evaluación, no limitándose a la toma de posición frente a alguna propuesta formulada desde las instancias de gobierno. Los centros escolares o instancias locales de gobierno procederían autónomamente a adoptar alguna/s de esas propuestas.
En un escenario deseable, debería fomentarse la libre participación en sistemas variados de evaluación, nacionales e internacionales, con atención a ciertas consideraciones sobre usos alternativos de recursos incluyendo el tiempo de los estudiantes y los docentes, tanto para la aplicación de pruebas como para la participación en el análisis y utilización de sus resultados. Habría múltiples (y parsimoniosas) formas de evaluación y las formas de medición se adaptarían a los fines que se persigue en cada instancia, fines que deben ser discutidos públicamente para maximizar el consenso al respecto.
Se habrá avanzado bastante más en la evaluación de logros, tanto aquella que debe realizarse dentro del aula y la escuela, que permite a los docentes afinar sus prácticas pedagógicas para hacerlas más efectivas y adecuadas a los distintos estilos y ritmos de aprendizaje de sus alumnos, como en la evaluación externa de resultados, que permite juzgar la efectividad del sistema escolar en su conjunto, la identificación de factores escolares y extraescolares que inciden en el desempeño y la retroalimentación a los otros componentes del sistema (currículo, textos, capacitación y formación docentes, políticas de gestión, etc.).

Se retroalimentará de manera que los resultados guíen las mejoras en la instrucción (identificación de distribuciones “típicas” de niveles de desarrollo de las comprensiones, capacidades y habilidades de los alumnos y propuestas de actividades de aprendizaje que más convendría desarrollar) y la toma de decisiones por distintos actores (padres, estudiantes, docentes, administradores, funcionarios, diseñadores de políticas). Las formas de utilización de resultados de las pruebas de logros mostrarán un balance entre objetivos de “responsabilización” (accountability) y de mejoramiento escolar
Los sistemas deseables de evaluación otorgarían la debida consideración a aspectos discriminativos que podrían esconderse en sus instrumentos de medición, evitando sesgos étnicos, culturales, regionales y de género que podrían tornar no comparables los resultados obtenidos por diversos grupos de estudiantes.
En un escenario deseable, los estándares y las evaluaciones estarán sirviendo para fomentar prácticas de responsabilización por los resultados. Los resultados en términos de logros estarían siendo constantemente analizados por una variedad de investigadores y analistas de políticas, y ligados con el debido cuidado técnico y político a cada uno de los diversos responsables de cuánto y cuán bien aprenden los estudiantes. Esto incluye no sólo a sus maestros, sino a quienes desarrollan y adaptan el currículo, a los productores de textos, a las autoridades locales y regionales, a los mismos padres de familia y a los propios estudiantes.

Una función importante de las evaluaciones y de la difusión de sus resultados sería el orientar y responsabilizar a los políticos por sus decisiones o falta de decisiones respecto a las orientaciones generales y las políticas y programas específicos que promueven los gobiernos nacionales.

Se habrían diseñado y legitimado arreglos organizacionales alternativos que permitan un más rápido y profundo proceso de institucionalización y legitimación de las evaluaciones, como podría ser quizás la delegación de la elaboración, administración y/o análisis de las pruebas a organismos privados, o la constitución de organismos con niveles mayores de autonomía respecto de la autoridad política de turno.
Existiría un nivel razonable de participación de los países de la región en pruebas internacionales, cuyos resultados son usualmente más impactantes sobre prensa y la opinión pública que las pruebas nacionales. Los resultados, previsiblemente insatisfactorios durante un buen tiempo más, proveerían a los policy-makers con argumentos fuertes para reclamar mayor apoyo presupuestal al sector. Permitirían avanzar también hacia una comprensión más generalizable sobre cómo y en qué condiciones inciden ciertos factores escolares tales como las edades de ingreso al sistema, la longitud de la jornada escolar, los métodos instruccionales, la capacitación docente, etc., sobre el desempeño del propio sistema, así como en el conocimiento sobre las relaciones entre rendimiento estudiantil y factores extraescolares y entre aquél y otras características de los países (crecimiento, empleo, etc.).
Los productores de pruebas internacionales estarán más sensibilizados a las necesidades de sus “clientelas” más diversificadas y, al contar con medios técnicos más sofisticados, podrán acomodar las mediciones a prioridades curriculares diversas, pilotear y probar la validez y confiabilidad de las preguntas y estímulos con que realizarán sus evaluaciones, preguntas y estímulos que se acercarán más a simulaciones de situaciones “de la vida real” y a la medición del desempeño que las pruebas actualmente disponibles. Es posible que las evaluaciones se “inserten” de manera menos disruptiva en la entrega del currículo, particularmente a medida en que se introduzcan nuevas tecnologías para la enseñanza y el aprendizaje, algunas de ellas a distancia pero potencialmente “personalizables”.

ESCENARIOS PROBABLES Y SUS CONSECUENCIAS
Las tendencias al incremento de la competitividad entre naciones para atraer inversiones sobre la base de las capacidades productivas de sus recursos humanos generarán necesidades y prácticas de “certificación de competencias”, en algunos casos de naturaleza más estrecha que lo que sería deseable como objetivo de los sistemas educativos. Pero, en otros, aun ese ámbito más pequeño de capacidades, habilidades y destrezas será más amplio que lo que los sistemas están efectivamente “entregando” como oportunidades de aprendizaje a sus alumnos. En ésta, como en otras áreas de la evaluación educacional, es previsible un rol ampliado de pruebas internacionales (o de pruebas producidas por empresas transnacionales), lo que podría, al menos en el corto plazo, acarrear un debilitamiento de las aún débiles capacidades de monitoreo o seguimiento con fines de mejoramiento de los aprendizajes y de evaluación con objetivos de responsabilización de diversos actores. Habría poca capacidad para promover la incorporación en el diseño de esas pruebas de criterios o contenidos basados en contextos realmente locales. No se trata simplemente de adaptar los formatos de preguntas a referentes o lenguaje y expresiones nacionales, sino de la capacidad de proponer prioridades respecto a las competencias y habilidades que realmente requieren mayor atención. Es pre-visible que se requiera un tiempo considerable para desarrollar esas capacidades –técnicas y políticas– y es conveniente empezar desde ya.

Se pronunciará la tendencia hacia una mayor segmentación de “mercados evaluativos”, con consecuencias en lo que se refiere a la equidad en las oportunidades de aprendizaje. Muchas escuelas e instituciones de educación superior privadas de elite se someterán a sistemas internacionales tipo Bachillerato Internacional o las que puedan producir y administrar directamente instituciones como ETS, con criterios o estándares internacionales de logros de aprendizaje, mientras que la mayoría de las escuelas públicas serían sujetos de evaluaciones referidas a criterios más localistas y de menor nivel de expectativas o exigencias.

Las líneas que actualmente separan el currículo (los currículos, en realidad) de las evaluaciones externas, y que separan también las evaluaciones externas de la evaluación interna formativa y sumativa que se realiza día a día en las aulas, se borrarán –como también se irán atenuando las líneas divisorias entre lo que se aprenderá en el aula y aquello que se aprehende en muchos otros contextos educativos. En un inicio, esto puede debilitar la calidad y la relevancia de los procesos educativos escolares, lo que debe ser objeto de monitoreo y medidas preventivas.
La diversificación de proveedores educativos, que trascenderán largamente a las escuelas formales de los sistemas, obligará a establecer mecanismos reguladores, algunos de ellos vía información (acreditación nacional o internacional de instituciones y sus resultados), otros vía incentivos o restricciones a su funcionamiento.

En los procesos de diseño y rediseño de los sistemas nacionales de evaluación y de las pruebas nacionales de logros, se incrementarán las tensiones entre las funciones de responsabilización y las de promoción del mejoramiento de los aprendizajes. Dada la escasez de recursos de todo tipo, habrá presiones para que un único conjunto de pruebas sirva para ambos propósitos y, posiblemente, bastantes más entre los mencionados al inicio de este texto. Esto podría generar resultados e inferencias no válidos y potencialmente costosos en términos de contribuir argumentos o justificaciones para decisiones equivocadas, y hace conveniente el establecimiento de “observatorios” externos a los sistemas que alerten sobre esos riesgos y eduquen a los usuarios respecto de los usos adecuados de la información resultante.

En muchos de los países de la región, para fortalecer el proceso de construcción y legitimación social de los sistemas de evaluación de logros escolares se han subrayado –al menos en el discurso– sus funciones de retroalimentadores del currículo, de insumo para el mejoramiento de la capacitación docente y la reflexión en las instituciones escolares sobre las fortalezas y debilidades de sus planes de estudio y prácticas pedagógicas. Muchas veces se ha descartado explícitamente su utilización para fines tales como la evaluación de estudiante individuales, su selección para cursos de estudios superiores alternativos, la evaluación de docentes y directivos, etc. Es muy probable –de hecho, ya está ocurriendo en varios países– que se pretenda en los próximos años utilizar los resultados de los alumnos para evaluar al menos parcialmente el desempeño docente. La “amenaza” de este tipo de utilización de las pruebas, así como la posibilidad de que se aten algunas “implicancias altas” (high stakes) en lo que se refiere a la graduación, retención de diplomas o retención en ciertos grados, posibilidad de una “segunda certificación” de logros que pueda llegar a tener una mayor valoración en un mercado laboral cada vez más competitivo, etc., generará conflictos que requerirán de capacidades de interlocución entre las unidades responsables de las evaluaciones y la sociedad civil mayores a las que hasta ahora generalmente se han visto obligadas a desplegar. Una posibilidad es que, frente a la eventualidad de esos conflictos, se descarte del todo la ligazón de algún tipo de estímulo o sanción frente a los resultados en las pruebas, lo cual podría debilitar su impacto potencial sobre el mejoramiento escolar.

Por otro lado, la reacción de, por ejemplo, las organizaciones gremiales docentes ante la “amenaza” del uso de las evaluaciones estudiantiles como parte de la evaluación de su propio desempeño profesional, o ante la inminencia de cualquier forma de evaluación de desempeño percibida como impuesta por instancias burocráticas o gubernamentales inducidas por consideraciones de diversa índole. Es poco previsible que en el lapso de los próximos quince años se reconstituya y consolide la identidad profesional de los docentes, muy debilitada por varias décadas de desatención y burocratización de sus carreras. Pese a que esporádicamente emergen visos de reacción ante esta situación, no es aún algo claramente perceptible que las organizaciones del gremio estén encaminadas a definir –autónoma aunque consultivamente– los estándares de desempeño que se exigirá a aquellos que quieran trabajar como maestros ni a definir el tipo de formación inicial y continua, así como una estructura de carrera, que asegurarían que los docentes escolares cuenten con los conocimientos, habilidades e incluso actitudes necesarios para practicar adecuadamente dicha ocupación. Sin esa autodefinición de estándares profesionales (y sin su legitimación ante la sociedad), difícilmente se podrá diseñar un sistema de evaluación de desempeño docente adecuado, y se tenderá a “echar mano” a los datos de las pruebas de rendimiento escolar, de difícil “adscripción” al comportamiento de ningún docente en particular. Esto podría generar mayor rechazo o deslegitimación a la evaluación de logros escolares.

Por supuesto, está el conocido riesgo de “estrechamiento del currículo” y de la “enseñanza orientada a las pruebas”, particularmente allí donde se continúen aplicando pruebas referidas a normas y con especificaciones técnicas deficientes (insuficientes cuadernillos rotatorios y cantidad y diversidad de reactivos, por ejemplo), y especialmente si se empieza a ligar algún tipo de implicancias a los puntajes obtenidos por los alumnos o las escuelas.

La aplicación repetida de pruebas, el análisis mejorado de los factores que explican el rendimiento estudiantil y el mayor acceso de actores sociales a la discusión de esos resultados forzarán una revisión continua del currículo y el establecimiento de canales horizontales y verticales tanto dentro del sistema escolar y de puentes de comunicación hacia fuera del mismo, que permitirían hacer de esa revisión curricular (o de estándares) un proceso permanente. Esto implica una ruptura deseable en la “manera de ser y hacer” de los organismos rectores de las políticas educacionales en la mayor parte de nuestros países e inversiones adicionales a las ya considerables realizadas en los últimos años en la reforma curricular, entendida generalmente, pese al discurso, como una experiencia limitada en el tiempo (y también en el espacio, generalmente el burocrático), pero probablemente tendrá que confrontar resistencias de las instancias ministeriales y de los que tienen a su cargo las bolsas del Tesoro Público. Mucho dependerá de la capacidad de los “otros actores” de demandar una actualización permanente y de sugerir maneras no costosas y descentralizadas de realizarla, y resulta necesario fomentar su participación en su diseño.


Autora
Patricia Arregui
La autora es investigadora del Grupo de Análisis para el Desarrollo (GRADE, Lima, Perú) y coordinadora del Grupo de Trabajo sobre Estándares y Evaluación del Programa de Promoción de la Reforma Educativa en América Latina (GTEE-PREAL). Agradece los comentarios a un primer borrador del mismo ofrecidos por Guillermo Ferrer. Las ideas y opiniones contenidas en el documento son responsabilidad propia y no implican una posición institucional al respecto de GRADE ni del PREAL.

Fuente
Análisis de prospectivas de la educación en la región de América Latina y el Caribe
Puede descargarse completa en
http://unesdoc.unesco.org/images/0013/001349/134963s.pdf

domingo, 4 de julio de 2010

PARTICIPACION EN PRUEBAS INTERNACIONALES

SISTEMAS DE DETERMINACION Y EVALUACION DE METAS DE LOGROS DE APRENDIZAJE ESCOLAR COMO INSTRUMENTOS PARA MEJORAR LA CALIDAD, LA EQUIDAD Y LA RESPONSABILIZACION EN LOS PROCESOS EDUCATIVOS EN AMERICA LATINA

LA SITUACION ACTUAL


PARTICIPACION EN PRUEBAS INTERNACIONALES


La participación latinoamericana en experiencias internacionales de medición de logros de aprendizaje es muy limitada. En 1997, con el respaldo y coordinación de la Oficina Regional de la UNESCO se realizó una evaluación en América Latina del aprendizaje en matemática y lenguaje en niños de tercero y cuarto grados. Participaron 13 países, aunque uno de ellos impidió la publicación de sus resultados y otro no procedió oportunamente a la entrega de las bases de datos, aparentemente, por problemas generados en cambios administrativos.


A la fecha pocos países de la región han participado en otras pruebas internacionales de medición del rendimiento. Cuando han participado, los resultados han sido generalmente muy insatisfactorios, aun si se restringen las comparaciones a países de similares niveles de desarrollo e ingresos nacionales. En más de un caso, los países se han abstenido a último momento de aplicar las pruebas o de autorizar la publicación de sus resultados. Colombia aprovechó positivamente sus pobres resultados en TIMSS (sólo 4% de sus alumnos participantes logró "clasificarse" dentro del 50% superior en el grado en el cual se inscribió Colombia para las pruebas) para poner en marcha un debate nacional al respecto y plantear una reforma curricular, mejoras en sus textos y en la capacitación docente, y ha decidido participar en PIRLS en el año 2001. Salvo ese caso nacional, se desconoce mayormente el impacto interno que ha tenido la participación de nuestros países en estas pruebas internacionales o los planes de difusión y utilización que tienen los países que recientemente se han incorporado a varios de estos sistemas de evaluación, como Chile, Argentina, Brasil y México.



Lo cierto es que, hasta la fecha, las experiencias de medición no permiten comparar los logros específicos de los países con estándares regionales o internacionales.


Recientemente han surgido muchas recomendaciones provenientes de organismos internacionales y regionales en el sentido de que es conveniente que los países latinoamericanos participen en esas pruebas internacionales de logro académico. Esas recomendaciones suelen sustentarse en el argumento de que los datos comparativos son muy útiles para informar a los países de su posición relativa y su competitividad vis-à-vis sus competidores en el mercado global de bienes y servicios. Están también basadas en el argumento de que las pruebas internacionales garantizan más alta calidad técnica y eficiencia que los sistemas nacionales y que pueden contribuir significativamente al desarrollo de capacidades locales en el campo de la evaluación.


Sin embargo, se sabe relativamente poco sobre los beneficios y riesgos potenciales de utilizar estas pruebas internacionales para medir y evaluar la calidad educativa de un país. No se cuenta con suficiente evidencia empírica sobre el impacto real que esas pruebas han tenido en los países que han participado anteriormente en ellas, particularmente en los países en desarrollo. ¿Qué usos específicos se han dado a sus resultados para mejorar la calidad de las escuelas? ¿En qué medida los participantes han logrado colocar sus inquietudes y sus preguntas fundamentales en la agenda de las evaluaciones? ¿En qué medida las competencias o contenidos que las pruebas miden reflejan objetivos fundamentales de los diversos participantes, y no sólo las de los técnicos que lideran su elaboración? ¿Han servido realmente para el desarrollo de capacidades nacionales que han continuado al servicio del desarrollo de mejores políticas domésticas? Incluso asumiendo que la tendencia hacia una mayor participación se hará "irresistible", ¿cómo pueden los países de la región prepararse técnica y políticamente para una experiencia más beneficiosa?


Son todas estas preguntas que bien valdría la pena intentar responder, aunque fuera tentativamente, antes de tomar decisiones al respecto, particularmente si la incursión en los sistemas internacionales de evaluación de aprendizajes puede acarrear la asignación prioritaria de recursos escasos a ellos, en detrimento de los esfuerzos locales, potencialmente más fácilmente vinculables a necesidades de información más inmediatas.


 


Autora


Patricia Arregui


La autora es investigadora del Grupo de Análisis para el Desarrollo (GRADE, Lima, Perú) y coordinadora del Grupo de Trabajo sobre Estándares y Evaluación del Programa de Promoción de la Reforma Educativa en América Latina (GTEE-PREAL). Agradece los comentarios a un primer borrador del mismo ofrecidos por Guillermo Ferrer. Las ideas y opiniones contenidas en el documento son responsabilidad propia y no implican una posición institucional al respecto de GRADE ni del PREAL.


Fuente


Análisis de prospectivas de la educación en la región de América Latina y el Caribe


Puede descargarse completa en


http://unesdoc.unesco.org/images/0013/001349/134963s.pdf


 

Related Posts Plugin for WordPress, Blogger...

Busca en mis blogs

Google+