Teorías de Medición Educacionales
Las Teorías de Medición sirven como marco teórico para el diseño e implementación de instrumentos de medición. Proporcionan métodos o procedimientos para determinar las características de los estímulos o preguntas que forman las pruebas.
A partir de las características obtenidas se derivan métodos para efectuar otros análisis que sean de interés para los usuarios de las pruebas.
Principales teorías de la Medición Usadas en Educación
Parámetros o Descriptores que Caracterizan a una Pregunta o Ítem de una Prueba
Aspectos Comunes de la Teoría Clásica TC y Teoría de Respuesta al Item TRI
Ambas teorías parten de los siguientes principios:
1. Que se han definido rigurosamente:
- la variable que se quiere medir.
- los indicadores que servirán de base para la construcción de los estímulos.
2. Que la construcción de los estímulos ha seguido todas las normas recomendadas.
3. Que la aplicación experimental ha sido diseñada considerando todas las características de la población objetivo y la muestra tiene un tamaño adecuado.
Teoría Clásica
Indicador de la habilidad: es el puntaje que se obtiene en la prueba, construido a partir del número de respuestas correctas o de alguna forma previamente definida.
Dificultad: proporción de personas que contesta correctamente una pregunta.
Discriminación: correlación entre contestar correcta o incorrectamente al ítem y el puntaje total en la prueba.
Supuestos de la TC
La TC supone que el puntaje que obtiene una persona en una prueba tiene dos componentes independientes entre sí y que se suman:
En consecuencia, el puntaje obtenido es una estimación del valor verdadero del rasgo que se mide.
Teoría de Respuesta al Item TRI
Los modelos TRI centran su interés en las preguntas.
Intentan establecer para cada ítem la probabilidad de ser contestado correctamente. Curva característica de un item CCI.
La probabilidad de una respuesta correcta depende de la habilidad del examinando, y de características propias de las preguntas, tales como: dificultad, discriminación y probabilidad de ser acertada por azar por un sujeto de muy baja habilidad.
Proporciona información sobre el nivel de precisión que una pregunta aporta en la estimación de un determinado nivel de habilidad. Esto se conoce con el nombre de “información de un ítem”.
Mientras mayor es la información que proporciona una pregunta en un determinado nivel de habilidad, mejor es el grado de precisión con que se estima ese nivel de habilidad. Esto permite construir pruebas muy ajustadas al propósito que se persigue.


Supuestos Claves de la TRI
Unidimensionalidad: la puntuación de una persona en el test depende exclusivamente de una dimensión o factor: su nivel en la habilidad medida.
Independencia local: Indica que los modelos asumen que las respuestas de las personas a un ítem son independientes de las respuestas a los otros ítemes.
Experiencias educacionales similares en los alumnos que rinden las pruebas.
Que la prueba no haya sido apurada, es decir, se asigne el tiempo necesario para que todos alcancen a abordar todos los ítemes.
Que
no haya
efectos
de contexto
no controlados. Es
de suma
importancia
que el
modelo
sea capaz
de predecir
con la
mayor
exactitud
posible
el comportamiento
de los
alumnos
frente
a cada
pregunta.
Ventajas
y Desventajas
de la
TRI
La principal ventaja potencial sobre la TC es la invarianza de los puntajes de la prueba y de las características de las preguntas.
La posibilidad de construir curvas de información para cada ítem lo que permite la optimización de la selección de las preguntas para una prueba con objetivos específicos.
Proporciona métodos alternativos para la detección de sesgos en las preguntas. Análisis DIF.
Proporciona métodos alternativos para la realización de procesos de equating, proceso por el cual dos pruebas se hacen comparables.
Sin embargo, todas las ventajas anteriores se pierden cuando no se cumplen los requisitos y en muchas ocasiones la naturaleza de las disciplinas medidas impide el cumplimiento de los supuestos lo que hace aconsejable no usar la TRI.
Algunos Ejemplos Típicos de No Cumplimiento de los Supuestos de la TRI
Ejemplos:
Finalmente, en el contexto de la selección, es decir, emplear la TRI con los resultados de las pruebas de admisión, conlleva algunos problemas prácticos:
Comprensión de los puntajes: postulantes con el mismo número de respuestas correctas, erradas y omitidas tengan distinto puntaje de habilidad.
Preparación por parte de los establecimientos educacionales de pruebas de ensayo, dado que no tienen la tecnología para asignar los puntajes.
Dificultad por parte de quienes no manejan la TRI de verificar si el proceso ha sido bien ejecutado.
Análisis del funcionamiento diferencial de un item DIF
Consiste en analizar si una pregunta se comporta de manera similar en distintos grupos que se pueden formar en la población que rinde una prueba.
Los parámetros que se analizan son:
Los grupos de análisis generalmente responden a características que de algún modo están produciendo puntajes distintos. Por ejemplo:
Análisis del Funcionamiento Diferencial de un Item DIF
Para determinar si las diferencias observadas son producto de la pregunta o bien es consecuencia de que los grupos analizados son estructuralmente distintos, es decir, han sido sometidos a experiencias educativas y ambientales que no son homologables, existen métodos estadísticos, tanto en la TC como en la TRI.
En este caso se habla de impacto, no de sesgo del item.
Ejemplo: resultados en una prueba que se aplica a grupos que han tenido una formación que se sabe es diferente. Por lo tanto, no es la prueba la causa de las diferencias en el nivel de logro, ella se encuentra en la formación de base de los alumnos.
EN SÍNTESIS
Referencias Bibliográficas en Español