SciELO - Scientific Electronic Library Online

 
vol.28 issue2Health-related quality of life in people with rheumatoid arthritis: Characterization of studies published from 2003 to 2013Prevalence and clinical impact of sensitization to latex and fruits in dentistry students at the University of Antioquia, and its relationship with allergy to fruits author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • On index processCited by Google
  • Have no similar articlesSimilars in SciELO
  • On index processSimilars in Google

Share


Iatreia

Print version ISSN 0121-0793

Iatreia vol.28 no.2 Medellín Apr./June 2015

https://doi.org/10.17533/udea.iatreia.v28n2a02 

INVESTIGACIÓN ORIGINAL

 

DOI 10.17533/udea.iatreia.v28n2a02

 

Falso o verdadero, ¿es esa la pregunta?

 

True or false: is that the question?

 

Falso ou verdadeiro, é essa a pergunta?

 

 

María Claudia Abaúnza Chagín1; Elga Johanna Vargas Carreño2; Carlos Javier Rincón Rodríguez3

 

1 Jefa de Área y Profesora Asociada, Área de Patología, Facultad de Medicina, Universidad de la Sabana,Chía, Colombia. maria.abaunza@unisabana.edu.co

2 Profesora Asistente, Área de Patología, Facultad de Medicina, Universidad de la Sabana, Chía, Colombia.

3 Profesor Asistente, Departamento Integrado de Investigación, Facultad de Medicina, Universidad de la Sabana, Chía, Colombia.

 

 

Recibido: marzo 07 de 2014
Aceptado: mayo 15 de 2014

 

 


RESUMEN

Objetivos: en los exámenes para estudiantes de medicina se emplean preguntas objetivas de la modalidad Falso o Verdadero (F/V), que solo tienen dos opciones de respuesta con alta probabilidad de ser contestadas correctamente por azar. El propósito de este trabajo fue demostrar que solicitar la argumentación de las respuestas disminuye el número de las correctas mejorando la capacidad de las preguntas para verificar los aprendizajes.

Métodos: se revisaron 8.188 preguntas de F/V que requirieron sustentación de la respuesta, aplicadas en 28 evaluaciones de Patología de la carrera de Medicina de la Universidad de la Sabana durante cuatro semestres. Las respuestas se clasificaron en correctas e incorrectas y las sustentaciones, en correctas, parcialmente correctas o incorrectas. Se calculó el coeficiente de concordancia kappa entre las preguntas F/V y las preguntas F/V con sustentación, así como por período y por evaluación.

Resultados: de un total de 8.188 preguntas, 6.112 (74,6%) fueron contestadas correctamente, 3.655 (44,6%) tuvieron sustentación correcta y 2.336 (28,5%) no fueron bien sustentadas, con un índice de concordancia global de 0,378 e índices bajos de concordancia por período.

Conclusión: las preguntas de F/V pueden acompañarse de una sustentación que argumente la respuesta con el objetivo de reducir la probabilidad de responder simplemente por azar, desarrollar procesos cognitivos superiores y competencias comunicativas.

PALABRAS CLAVE

Educación Médica, Educación de Pregrado en Medicina, Evaluación Educacional


SUMMARY

Objectives: Standard tests designed for medical students frequently include objective True/ False (T/F) questions, in which there are only two possible answers that can be successfully reached at random. The purpose of this work was to demonstrate that asking for support of the answers diminishes the number of randomly correct ones, so improving the ability of questions to verify learnings.

Methods: 8.188 T/F questions whose answers had to be supported; they were applied in 28 written tests of Pathology, at the undergraduate medical program (La Sabana University, Chía, Colombia). Answers were classified as correct or incorrect, and their support, as correct, partially correct and incorrect. In order to analyze the data, the kappa agreement coefficient between T/F questions and T/F questions with support was calculated, as well as per term and per test.

Results: Out of 8.188 T/F questions, 6.112 (74.6%) were correctly answered as true or false, 3.655 (44.6%) had a correct support, and 2.336 (28.5%) were not correctly supported, exhibiting a global agreement index of 0.378 and low agreement indexes per term.

Conclusion: T/F questions could be accompanied by support of the answers in order to reduce the probability of randomly correct ones, to enhance the development of superior cognitive processes, and communicative essential competences.

KEY WORDS

Education, Medical, Educational Measurement, Undergraduate Medical Education

RESUMO


Objetivos: nos exames para estudantes de medicina se empregam perguntas objetivas da modalidade Falso ou Verdadeiro (F/V), que só têm duas opções de resposta com alta probabilidade de ser contestadas corretamente por casualidade. O propósito deste trabalho foi demonstrar que solicitar a argumentação das respostas diminui o número das corretas melhorando a capacidade das perguntas para verificar as aprendizagens.

Métodos: revisaram-se 8.188 perguntas de F/V que requereram sustentação da resposta, aplicadas em 28 avaliações de Patologia da carreira de Medicina da Universidade da Sabana durante quatro semestres. As respostas se classificaram em corretas e incorretas e as sustentações, em corretas, parcialmente corretas ou incorretas. Calculou-se o coeficiente de concordância kappa entre as perguntas F/V e as perguntas F/V com sustentação, bem como por período e por avaliação.

Resultados: de um total de 8.188 perguntas, 6.112 (74,6%) foram respondidas corretamente, 3.655 (44,6%) tiveram sustentação correta e 2.336 (28,5%) não foram bem sustentadas, com um índice de concordância global de 0,378 e índices baixos de concordância por período.

Conclusão: as perguntas de F/V podem acompanhar-se de uma sustentação que argumente a resposta com o objetivo de reduzir a probabilidade de responder simplesmente por casualidade, desenvolver processos cognitivos superiores e concorrências comunicativas.

PALAVRAS CHAVES

Avaliação Educacional, Educação Médica, Educação de Graduação em Medicina


 

INTRODUCCIÓN

La evaluación es una de las partes más importantes del proceso enseñanza-aprendizaje y su valor ha sido reconocido desde el siglo IV a. C., cuando Sócrates preguntaba a sus discípulos para comprobar sus habilidades. De acuerdo con Ianfrascesco (1), es un acto educativo, un proceso sistemático y permanente que comprende la búsqueda y el análisis de la información sobre la calidad del desempeño, el rendimiento y los logros del estudiante, así como de la calidad de los procesos, procedimientos y estrategias empleados por los educadores para hacer un diagnóstico conforme a los objetivos de formación y tomar decisiones que orienten y aseguren el aprendizaje (2). La evaluación debe ser dinámica, multidimensional, reflexiva, autónoma, responsable, continua, cooperativa, flexible, integral y sistemática (3,4).

La evaluación puede ser sumativa o formativa. La primera de ellas ha tenido una aceptación amplia, se utiliza para asignar una calificación y dar valores estadísticos, y puede ocurrir en distintos momentos o al final del período académico. La evaluación formativa se emplea para mejorar la calidad de la enseñanza, utiliza la autoevaluación y la retroalimentación, facilita a los estudiantes la adquisición de destrezas de aprendizaje y el dominio del material aprendido, y permite correcciones continuas del proceso educativo (1,4,5,6).

Después de que el docente conoce qué es evaluación, por qué y para qué evaluar, a quién y cuándo, se debe resolver la pregunta de cómo evaluar y es aquí donde aparecen las teorías de la evaluación y el abanico de instrumentos que deben ser conocidos en profundidad, diseñados y elaborados por los profesores. Estos instrumentos deben ser planeados, validados, variados, claros, precisos, novedosos y adecuados a los contenidos de los saberes de cada elemento de la competencia, aplicados por diferentes docentes y construidos con enunciados neutrales que no condicionen las respuestas, procurando mejorar las habilidades de pensamiento de los estudiantes (1,3,7).

En las facultades de Medicina ha sido tradicional el uso de exámenes de tipo objetivo con predominio de las preguntas convergentes como selección múltiple, apareamiento, complementar y falso o verdadero (F/V) (1,5,8), las cuales se emplean para evaluar aprendizajes específicos o factuales con el fin de comprobar si el estudiante posee los conocimientos requeridos. En las pruebas objetivas los estudiantes tienen poca oportunidad para argumentar o ser originales (3,9,10).

En las preguntas de F/V el enunciado solo tiene dos posibilidades dando una información dicotómica que permite evaluar niveles cognoscitivos como conocimiento y comprensión (11,12). En este tipo de preguntas hay tres posibles causas de respuestas incorrectas: el no conocimiento, el conocimiento parcial y el anticonocimiento (13,14).

El propósito de este trabajo fue demostrar que solicitar la argumentación de las respuestas disminuye el número de las correctas comparadas con la simple opción de contestar F o V.

 

MATERIALES Y MÉTODOS

Se revisaron 28 evaluaciones escritas aplicadas a estudiantes de Patología del programa de Medicina de la Universidad de La Sabana durante cuatro semestres (períodos) en los años 2006 y 2007. Cada período incluyó los mismos temas divididos en dos secciones: Patología Básica y Patología Sistémica.

De estas evaluaciones se seleccionaron todas las preguntas de F/V que requirieron sustentación de la respuesta. Las tres primeras pruebas incluyeron temas de Patología Básica y las restantes, de Patología Sistémica. Los docentes que dictaron las clases fueron los encargados de plantear y evaluar las preguntas.

Se encontraron 8.188 preguntas de F/V con sustentación, que fueron reevaluadas de manera conjunta por dos docentes de Patología de la Universidad de La Sabana y los datos se incluyeron en una base de Excel con las siguientes convenciones: cero (0) si la pregunta estaba correctamente clasificada como falsa o verdadera, uno (1) si estaba incorrecta o nueve (9) si no había sido contestada. La sustentación o argumentación se evaluó como cero (0) si estaba correcta, uno (1) si estaba parcialmente correcta, dos (2) si estaba incorrecta y nueve (9) si no había sido contestada.

Para considerar una sustentación como correcta debía ser congruente con el enunciado, completa, no corresponder a una paráfrasis y estar de acuerdo con la literatura pertinente para el nivel de los estudiantes. Se consideró que estaba parcialmente correcta cuando era congruente, pero estaba incompleta y se la consideró incorrecta cuando la argumentación era incongruente, incomprensible o consistía en una paráfrasis. Cuando hubo discrepancia entra las evaluadoras, se revisó la literatura correspondiente llegando siempre a un consenso.

Para el análisis de los datos, se obtuvo el número de estudiantes y preguntas por cada período. Posteriormente, se calculó el coeficiente kappa de concordancia entre el enunciado (F o V) y el enunciado con sustentación. Para ello se excluyeron las preguntas no sustentadas y se agruparon bajo la categoría incorrecta las sustentaciones incorrectas y parcialmente correctas. Adicionalmente, se calculó el coeficiente kappa por período y por prueba. Se hizo la interpretación del coeficiente a partir de los siguientes puntos de corte: < 0,2 pobre; 0,21 a 0,4 baja; 0,41 a 0,6 moderada; 0,61 a 0,8 buena y 0,81 a 1 muy buena.

 

RESULTADOS

En total se evaluaron 8.188 preguntas de F/V con sustentación aplicadas a 267 estudiantes en cuatro períodos académicos. La distribución por período se presenta en la tabla 1.

Del total de las preguntas (8.188), se evidenció que 3.655 (44,6%) tenían sustentación correcta, 1.688 (20,6%) tenían sustentación incorrecta, 648 (7,9%) tenían sustentación parcialmente correcta y 121 (1,5%) no tenían sustentación; por lo tanto, 2.336 (28,5%) respuestas no fueron bien sustentadas. La concordancia global fue de 0,378, es decir, baja. Por otra parte, en 1.743 (21,3%) preguntas el enunciado fue calificado como incorrecto y no respondieron 333 (4,1%) preguntas (tabla 2).

Al discriminar por período, se observó que el porcentaje de preguntas con respuesta F o V correcta y sustentaciones incorrectas –incluyendo las parcialmente correctas- fue de 26,6%; 28,1%; 28,4% y 31% para cada uno de acuerdo con el orden cronológico. Los índices kappa mostraron que la concordancia fue baja, con los siguientes valores en los períodos 1, 2, 3 y 4, respectivamente: 0,3925; 0,4125; 0,3672 y 0,3257 (tabla 3)

Finalmente, al discriminar por cada una de las evaluaciones o pruebas se observó que el porcentaje de preguntas con respuesta F o V correcta y sustentaciones incorrectas –incluyendo las parcialmente correctas- osciló entre 35,7% de la prueba 6 y 22,3% de la prueba 4. Los índices kappa muestran que la concordancia fue baja a moderada, con los siguientes valores para cada una de las 12 pruebas aplicadas: 0,4007; 0,4382; 0,3376; 0,4228; 0,4101; 0,288; 0,446; 0,3096; 0,318; 0,3862; 0,3953 y 0,351 (tabla 4).

 

DISCUSIÓN

Las pruebas de tipo objetivo tienen la ventaja de poderse aplicar a grupos grandes y obtener una calificación rápida y sencilla, aunque requieren mucho tiempo para su adecuada elaboración. Estas pruebas pueden medir niveles superiores de pensamiento y solución de problemas (1). Para la National Board of Medical Examiners, de los Estados Unidos de América, las preguntas de selección de la mejor respuesta son las más apropiadas para evaluar la aplicación de conocimientos, la integración, la síntesis y el juicio (15).

Las preguntas de F/V solo tienen dos posibilidades de respuesta y, por lo tanto, una alta probabilidad (50%) de ser contestadas correctamente por azar (11,14,16). En este tipo de preguntas, los estudiantes se limitan a contestar si un enunciado es o no verdadero, no hay oportunidad de respuestas diferentes y permiten evaluar los niveles más simples de la taxonomía de Bloom (5,9,11,12,17). Además, se ha demostrado que las preguntas de F/V pueden producir un efecto de sugestión negativa que favorece el aprendizaje de información incorrecta (18). En un estudio de Burton, se encontró que al hacer un test de 10 preguntas con dos opciones de respuesta, el índice 50/60 PIP (Probability of inappropriately passing) es igual al 52,6%; es decir, que la probabilidad de que un estudiante con el 50% del conocimiento alcance el resultado esperado de un estudiante con el 60% del conocimiento, es igual al 52,6% (19).

Algunos autores han diseñado variantes de las preguntas de F/V para optimizar este tipo de evaluación como seleccionar ítems erróneos dentro de párrafos de lecturas (20) o penalizar las respuestas erradas (14). Nosotros empleamos otra alternativa a este tipo de pregunta que consiste en solicitar la justificación de la respuesta F o V.

Consideramos que las preguntas de F/V clásicas son de difícil elaboración en Medicina, dado que muy pocas temáticas de este campo permiten aplicar el concepto de 100% falso o verdadero y por el contrario existen numerosas ''zonas grises''; además, nos exponemos a inexactitudes y a preguntar datos superfluos o temas irrelevantes. Por el contrario, si se solicita sustentar las respuestas se promueven en los estudiantes el análisis, la argumentación y el juicio, además de incentivar el adecuado uso de las normas gramaticales y ortográficas. De este modo, no solo evaluamos conocimientos de Patología, sino que mejoramos las competencias comunicativas esenciales en el ejercicio médico.

En nuestra experiencia docente hemos tratado de mantener un proceso permanente de reflexión y autoevaluación tanto en la elaboración como en la implementación de nuestras evaluaciones. Consideramos que los profesores no debemos limitarnos a emplear un solo tipo de pregunta, aunque existen tendencias que consideran que las pruebas con preguntas de selección múltiple son el tipo ''ideal'' de evaluación escrita.

Los docentes debemos evaluar constantemente los instrumentos de valoración que aplicamos a nuestros estudiantes, de acuerdo con los niveles cognitivos y competencias esperadas; estos instrumentos no se deben concebir como simples elementos rutinarios de modelos pedagógicos clásicos y deben ser objeto de renovación, combinación e innovación continuas, tal como lo exige un proceso evaluativo dinámico.

En este trabajo se encontró que 6.112 (74,6%) de un total de 8.188 preguntas estaban contestadas correctamente como falsas o verdaderas, pero solo 3.655 (44,6%) tenían una sustentación correcta con bajos índices de concordancia global y de concordancia por período. Estos valores de coeficiente kappa nos indican que es valioso incorporar la sustentación en este tipo de preguntas, ya que si los valores se hubieran acercado a uno, no habría diferencia entre realizar preguntas F/V o preguntas F/V con sustentación.

Cuando se analizaron los resultados de concordancia entre las evaluaciones, los índices kappa mostraron que ella fue de baja a moderada; los porcentajes más bajos (por debajo del 60%) se detectaron en las pruebas 6, 8 y 9. Las pruebas 8 y 9 correspondieron principalmente a las temáticas de patología hematolinfoide y endocrino, que en nuestra opinión son de mayor grado de dificultad, incluso para médicos patólogos, por su complejidad y extensión.

Además, no se observó una mejoría en la concordancia a medida que se aplicaban las pruebas en cada uno de los períodos académicos. Finalmente, solo 8 (0,1%) y 6 (0,07%) preguntas que no fueron clasificadas como falsas o verdaderas poseían una sustentación correcta o parcialmente correcta, respectivamente, lo que se podría explicar por falta de atención durante el desarrollo de la prueba y la presencia de algún grado de conocimiento del estudiante; sin embargo, estas fueron situaciones infrecuentes.

 

CONCLUSIONES

La formación docente requiere un conocimiento amplio sobre el proceso evaluativo en el que es pertinente seleccionar los instrumentos de acuerdo con las competencias que se espera alcanzar. Así como otros autores han diseñado variantes de las preguntas de F/V, nosotros proponemos que en este tipo de preguntas se le solicite al estudiante una corta sustentación en la que argumente su respuesta, con el objetivo de reducir la probabilidad de responder simplemente por azar y desarrollar procesos cognitivos superiores y competencias comunicativas esenciales en la formación médica.

 

REFERENCIAS BIBLIOGRÁFICAS

1. Ianfrancesco G. La evaluación integral y del aprendizaje: Fundamentos y estrategias. Bogotá: Cooperativa Editorial Magisterio; 2005. p. 17-40.         [ Links ]

2. Henson KT, Eller BF. Psicología Educativa para la enseñanza eficaz. México: Thomson; 2000.         [ Links ]

3. Tobón S. De la evaluación a la valoración de competencias. En: Formación Integral y Competencias: Pensamiento complejo, currículo, didáctica y evaluación. 3ª ed. Bogotá: ECOE; 2010. p. 279-309.         [ Links ]

4. Rodríguez J. Módulo de Evaluación, Especialización en Educación Médica. Chía: Universidad de La Sabana; 2004. p. 1-33.         [ Links ]

5. Orlich D, Harder R, Callahan R, Kauchak D, Pendergrass RA, Keogh A, et al. Técnicas de enseñanza. México: Limusa-Noriega; 1995. p. 50-2, 231-9.         [ Links ]

6. Venturelli J. La evaluación en el proceso de formación de los profesionales médicos. Principios de Evaluación Formativa. En: Educación médica: Nuevos enfoques, metas y métodos. Washington: Serie PALTEX Salud y Sociedad OPS/OMS; 2003. p. 164-88.         [ Links ]

7. de Camilloni ARW, Celman S, Litwin E, Palou de Maté MC. La evaluación de los aprendizajes en el debate didáctico contemporáneo. Buenos Aires: Paidos; 1998. p. 3, 71-6.         [ Links ]

8. Pamphlett R. It takes only 100 true-false items to test medical students: true or false? Med Teach. 2005 Aug;27(5):468-72.         [ Links ]

9. McInerney DM, McInerney V. Educational Psychology: Constructing Learning. 2° ed. Sydney: Prentice Hall; 1998. p. 297-304.         [ Links ]

10. Schwartz PL, Loten EG. Brief problem-solving questions in medical school examinations: is it necessary for students to explain their answers? Med Educ.1999 Nov;33(11):823-7.         [ Links ]

11. University of Waterloo. Exam Question: Types, Characteristics and suggestions [Internet]. (cited 2014 Mar 3). Available from: https://uwaterloo.ca/centre-forteaching-excellence/teaching-resources/teachingtips/developing-assignments/exams/questions-typescharacteristics-suggestions         [ Links ]

12. Richardson R. The multiple choice true/false question: what does it measure and what could it measure? Med Teach. 1992;14(2-3):201-4.         [ Links ]

13. Koeslag JH, Melzer CW. The incorrect response in multiple-choice examinations. S Afr Med J. 1981 Oct;60(15):591-2.         [ Links ] 14. Koeslag JH, Melzer CW, Schach SR. Penalties in multiple- choice and true-false questions. S Afr Med J. 1983 Jan;63(1):20-2.         [ Links ]

15. Case S, Swanson D. Formatos de ítems de opción múltiple. En: Cómo elaborar preguntas para evaluaciones escritas en el área de ciencias básicas y clínicas. Philadelphia: National Board of Medical Examiners; 2006. p. 13-8.         [ Links ]

16. Frisbie D, Becker D. An Analysys of Texbook Advice About True-False Tests. Appl Meas Educ. 1991;4(1):67-83.         [ Links ]

17. Raths L, Wassermann S. Las operaciones del pensamiento. En: Como enseñar a pensar. Buenos Aires: Paidos; 1997. p. 27-50.         [ Links ]

18. Toppino T, Brochin H. Learning from test: The case of True/ False examinations. J Educ Res. 1989 Nov- Dec;83(2):119-24.         [ Links ]

19. Burton R. Quantifying the Effects of Chance in Multiple Choice and True/False Tests: question selection and guessing of answers. Assess eval high educ. 2001;26(1):41-50.         [ Links ]

20. Goldwater B, Grabavac D, Acker L. The distorteditem test: a true-false test with a difference. IJT. 2005;5(1):75-80.         [ Links ]