Introducción
La cirugía laparoscópica ha transformado significativamente la práctica quirúrgica 1,2. Esta técnica ha ganado terreno en múltiples especialidades y se proyecta que su adopción continúe en ascenso. En la base de datos nacional del “Accreditation Council for Graduate Medical Education” (ACGME), se ha documentado un incremento del 36 % en el número de procedimientos laparoscópicos realizados por residentes de cirugía general 3. Más aún, especialidades como la cirugía bariátrica ya realizan más del 90 % de sus procedimientos por esta vía 4. Así mismo, en regiones como América Latina, la implementación de la laparoscopia también es significativa; según el Latin American Surgical Outcomes Study (LASOS), el 22,4 % de los procedimientos se realizan por laparoscopia, y en cohortes colombianas, como el estudio COLSOS, esta proporción alcanza el 23,7 % 5,6.
La formación quirúrgica ha cambiado notablemente, dejando atrás el modelo tradicional de “ver uno, hacer uno, enseñar uno” 7 y actualmente, los médicos residentes deben dominar técnicas mínimamente invasivas, como la laparoscopia 8.
Sin embargo, enfrentan limitaciones en el proceso, como la reducción de las horas quirúrgicas, la mayor complejidad de los pacientes y la fragmentación por subespecialidades, lo que ha llevado a menor exposición a las técnicas laparoscópicas durante su entrenamiento 9-14. Ante esta problemática, la simulación basada en modelos de aprendizaje motor, como el de Fitts y Posner, es esencial para desarrollar habilidades psicomotoras antes de realizar procedimientos en pacientes reales 15-19.
La simulación laparoscópica permite un entorno seguro para el desarrollo de habilidades quirúrgicas. Aunque para que la simulación sea efectiva es fundamental evaluar objetivamente el desempeño, no existen puntos de corte universalmente definidos que indiquen cuándo un residente alcanza la “proficiencia” (un término que proviene del anglicismo proficiency, el cual se ha incorporado en la literatura académica en español para describir el nivel de dominio y destreza adquirido en una habilidad específica(, especialmente en contextos locales.
La falta de una enseñanza guiada y un adecuado mecanismo de evaluación sistemático puede limitar significativamente el impacto en los entrenamientos 20. Las curvas de aprendizaje tradicionales presentan limitaciones para reflejar la variabilidad individual y definir puntos claros en la competencia, además de distinguir entre la cantidad y calidad del desempeño técnico 1,20,21. Como alternativa más precisa, la metodología CUSUM (Cumulative Sum Control Chart) ha demostrado ser precisa para monitorear el aprendizaje en simulación, permitiendo detectar tempranamente la competencia y adaptar el proceso de enseñanza a las necesidades específicas de cada residente 1,20-22.
Algunos estudios previos en la Universidad CES, en Medellín, Colombia, han aplicado curvas de aprendizaje en simulación laparoscópica basadas en los Fundamentals of Laparoscopic Surgery (FLS), mostrando que, tras programas estructurados de entrenamiento, los residentes logran estabilizar su curva de aprendizaje y superar el 70-80 % de la competencia esperada en tareas básicas de laparoscopia, aunque existe una variabilidad del desempeño técnico entre los residentes 1,23.
Esta heterogeneidad sugiere que las métricas convencionales, como el número de repeticiones o los tiempos de ejecución, resultan insuficientes para capturar la complejidad del proceso de aprendizaje quirúrgico. Por ello, este estudio propone aplicar análisis CUSUM para evaluar el desarrollo de las habilidades laparoscópicas en los médicos residentes de primer año del programa de Cirugía general, con el objetivo de caracterizar sus trayectorias de aprendizaje, establecer parámetros objetivos de evaluación y aportar evidencia sobre la eficacia del entrenamiento simulado en la formación quirúrgica. Este enfoque aportará evidencia valiosa para optimizar la formación quirúrgica.
Métodos
Diseño y población del estudio
Se realizó una cohorte prospectiva de los médicos residentes de Cirugía general de primer año en la Universidad CES, que completaron el programa de entrenamiento y su evaluación en cirugía laparoscópica entre 2019 y 2025. No se excluyó ningún residente. El muestreo fue no probabilístico, por conveniencia.
Proceso y recolección de datos
Los ejercicios realizados fueron adaptaciones de los propuestos por el programa Fundamentals of Laparoscopic Surgery (FLS) de la SAGES 4. El entrenamiento incluyó cinco ejercicios básicos: transferencia de objetos, corte, ligadura, sutura extracorpórea y sutura intracorpórea. Se llevaron a cabo en simuladores de entrenamiento tipo pelvic trainer disponibles en la universidad, empleando materiales y modelos diseñados para simular condiciones reales de tejido y resistencia laparoscópica.
Cada participante completó al menos 40 repeticiones por ejercicio. Las sesiones se programaron con una duración de dos horas semanales, incluyendo pausas para retroalimentación por expertos, individualizada para cada residente. El proceso estuvo supervisado por dos cirujanos generales y un instrumentador quirúrgico, todos capacitados en simulación clínica y educación a través de cursos institucionales.
Para cada repetición se registraron: número de repetición, tiempo de ejecución (en segundos) y número de errores técnicos. La recolección de datos fue realizada por los instructores, quienes consignaron la información en formatos estandarizados y la ingresaron en una base de datos electrónica para su análisis posterior.
En caso de identificar dificultades significativas en el desempeño de algún residente durante la simulación, se ofreció retroalimentación adicional y acompañamiento educativo, priorizando siempre el bienestar y el desarrollo profesional de los participantes. El residente entonces tenía que realizar más intentos, hasta que alcanzara los objetivos técnicos en tiempo y número de errores.
Análisis estadístico
Se realizó un análisis descriptivo utilizando medidas de tendencia central y dispersión para evaluar el desempeño y tiempo de los residentes en los cinco ejercicios. Las tasas de aprobación por ejercicio se calcularon considerando únicamente aquellos intentos sin errores técnicos y tomando como referencia tres criterios temporales. El primer criterio correspondió a los tiempos establecidos por el programa FLS, definidos a partir del promedio de ejecución de cirujanos expertos para cada ejercicio 4. El segundo utilizó como referencia los tiempos para residentes de primer año reportados en estudios previos, específicamente los publicados por la Universidad de Oregón. Dado que no se disponía de estándares locales de comparación, se generó un criterio ajustado al contexto mediante el cálculo del tiempo promedio por ejercicio, excluyendo los valores extremos mayores a dos desviaciones estándar (DE), siguiendo la metodología propuesta por Hoops HE, et al. 24.
Para el análisis del proceso de aprendizaje se empleó el método CUSUM (Cumulative Sum Control Chart), una herramienta de análisis secuencial que transforma los datos individuales en una suma acumulativa de desviaciones respecto a un valor esperado 21,25,26. En estas curvas, una pendiente ascendente representa la fase de aprendizaje (tiempos mayores al promedio), mientras que una pendiente descendente indica mejora progresiva o estabilización del desempeño 25.
Se aplicó regresión lineal segmentada (piecewise) para identificar dos puntos de inflexión en las curvas de aprendizaje, siguiendo la metodología descrita por Stern N, et al. 27 y Muggeo VMR 28. El primer punto corresponde a la transición entre la fase inicial de aprendizaje y la etapa de “proficiencia”, caracterizada por una estabilización del tiempo de ejecución. El segundo punto marca el paso a la competencia, representado por un descenso progresivo en el tiempo, visible como una pendiente descendente en la curva. Algunos autores diferencian la “proficiencia” de la competencia señalando que una implica la adquisición de conocimientos, habilidades o juicio técnico, mientras que la otra implica la ejecución autónoma, consistente y sostenida de una tarea 29. Este enfoque se puede aplicar para analizar tanto el progreso individual por residente como el comportamiento grupal por especialidad 21.
Finalmente, se calcularon y presentaron las medidas de tendencia central y dispersión de estos puntos de cambio, con el fin de caracterizar de forma integral las fases del aprendizaje técnico laparoscópico. Todos los análisis se realizaron en R Studio (R Core Team. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria https://www.R-project.org/) versión 4.3.3.
Resultados
Se analizaron un total de 4162 repeticiones, correspondientes a 22 médicos residentes que completaron los cinco ejercicios laparoscópicos. En promedio, se realizaron 38 repeticiones para los ejercicios de transferencia (DE 2,4) y corte (DE 3,8); para los ejercicios de ligadura, sutura intracorpórea y sutura extracorpórea, el promedio de repeticiones fue de 39 (DE 3,7), 35 (DE 6,5) y 37 (DE 4,3), respectivamente. El tiempo promedio global de ejecución fue de 150 segundos (DE 92,7), con una amplia variabilidad entre los distintos ejercicios. La sutura intracorpórea y el corte fueron los que requirieron mayor tiempo de realización, mientras que la ligadura y la sutura extracorpórea presentaron tiempos significativamente menores (Tabla 1).
Tabla 1. Tiempos y aprobación por cada ejercicio laparoscópico

* DE: desviación estándar; Q1 - Q3: rango intercuartílico; FLS: Fundamentals of Laparoscopic Surgery. ** Según los tiempos descritos por Hoops HE, et al. 24. *** Según el promedio de tiempos por ejercicio excluyendo los valores extremos.
Al aplicar los criterios de aprobación basados en los tiempos establecidos por el programa FLS, se observó una baja tasa global de aprobación (20,3 %). Esta tendencia fue especialmente marcada en los ejercicios de transferencia y corte, en los que más del 95 % de las repeticiones fueron reprobadas. En contraste, los ejercicios de ligadura y sutura extracorpórea mostraron un desempeño relativamente mejor, con tasas de aprobación cercanas al 44 %. Al utilizar como referencia los tiempos promedio de residentes de primer año, la tasa global de aprobación aumentó al 25,9 %, aunque persistieron bajos desempeños en transferencia y corte, y se observó una mejora en la aprobación de la sutura intracorpórea.
Finalmente, al ajustar los criterios de aprobación a un estándar local, hubo una mejora sustancial en la tasa global de aprobación (36,0 %), con incrementos particularmente notables en los ejercicios de transferencia y corte. Sin embargo, en este escenario, las tasas de aprobación disminuyeron en ligadura (30,5 %), sutura extracorpórea (39,6 %) e intracorpórea (37,6 %). En los tres criterios de evaluación aplicados, se observó una tendencia consistente: a mayor número de intentos, mayor fue el porcentaje de aprobación (Figura 1).
El análisis mediante curvas CUSUM permitió identificar el número de repeticiones necesarias para alcanzar dos hitos clave del aprendizaje técnico: la “proficiencia” y la competencia (Figura 2). En promedio, los residentes alcanzaron la “proficiencia” técnica entre los 9 y 11 intentos, dependiendo del ejercicio. La menor cantidad de repeticiones se observó en la sutura extracorpórea (media 9,5; DE 5,9) y en la sutura intracorpórea (media 9,6; DE 4.3), mientras que la transferencia y el corte requirieron un poco más de repeticiones.

Figura 2. Curvas CUSUM grupales por ejercicio laparoscópico: A. Transferencia, B. Corte, C. Ligadura, D. Sutura extracorpórea y E. Sutura intracorpórea. Se señalan los puntos de inflexión correspondientes a la adquisición de competencia y “proficiencia” para cada ejercicio.
En cuanto a la competencia, el número de intentos necesarios fue consistentemente mayor, con un promedio global que osciló entre 21 y 26 repeticiones. El ejercicio de corte fue el que más repeticiones requirió para alcanzar este umbral (media 25,9; DE 7,1), seguido por la sutura intracorpórea (media 24,5; DE 6,2) y la transferencia (media 24; DE 6,1).
Aunque se observó una amplia variabilidad entre residentes, independiente del ejercicio, el 75 % de los residentes alcanzaron la “proficiencia” en menos de 16 ejercicios y la competencia en menos de 31 (Tabla 2).
Discusión
En la educación quirúrgica, no es suficiente contar con herramientas de simulación como el pelvic trainer, modelos animales o cadavéricos. Tampoco basta con seguir procesos estructurados mediante ejercicios estandarizados, como los propuestos por el programa FLS 4. La evaluación objetiva y sistemática constituye el pilar fundamental para determinar si realmente se han adquirido las competencias técnicas requeridas.
Si bien las ventajas de la simulación como herramienta formativa están ampliamente reconocidas (incluyendo beneficios en la adquisición de habilidades psicomotoras, la reducción de tiempos quirúrgicos y la mejora de desenlaces clínicos 30,31(, persiste el debate sobre cuál es el método de evaluación más adecuado para poblaciones específicas. Existen instrumentos validados, como GOALS (Global Operative Assessment of Laparoscopic Skills), OSATS (Objective Structured Assessment of Technical Skills) y diversas escalas de desempeño técnico, que ofrecen criterios objetivos 20,31,32, aunque tienen limitaciones para capturar la variabilidad individual y no reflejan con suficiente sensibilidad la evolución del aprendizaje en tiempo real.
La literatura actual carece de un método educativo único que se adapte a las características particulares de los médicos residentes evaluados y que permita definir con precisión el momento en que se alcanza la competencia técnica; menos aún en la población local. En trabajos en población colombiana previamente publicados 1,23, el uso de curvas de aprendizaje tradicionales permitió representar gráficamente el rendimiento técnico a lo largo del tiempo, evidenciando la mejoría gradual del residente hasta alcanzar un umbral de competencia.
Sin embargo, estas herramientas presentan limitaciones importantes. Por un lado, la determinación del momento en que se alcanza la competencia es, en muchos casos, subjetiva y susceptible a variaciones entre evaluadores. Por otro lado, su sensibilidad ante pequeños cambios de desempeño puede no ser adecuada, y debido a la estandarización de los procedimientos evaluados, la dificultad técnica no se ajusta dinámicamente. Además, no permiten evaluar ni comparar efectivamente la evolución de diferentes residentes, lo cual limita su utilidad para la toma de decisiones pedagógicas personalizadas.
En este estudio, el análisis CUSUM demostró ser una herramienta robusta y precisa para evaluar el proceso de adquisición de habilidades laparoscópicas. Esta metodología supera varias de las limitaciones mencionadas al ofrecer una representación objetiva y secuencial del desempeño, basada en desviaciones acumulativas respecto a un valor esperado. Una de sus principales ventajas radica en su capacidad para reducir la subjetividad de la evaluación, estableciendo puntos de cambio claros y reproducibles en el aprendizaje técnico 21,29,33,34. Este enfoque se alinea con los principios de la educación médica basada en competencias, que exige métricas sensibles, estandarizadas y aplicables al seguimiento individual 35.
La amplia variabilidad observada entre los residentes (con un 75 % alcanzando la “proficiencia” en menos de 16 intentos y la competencia en menos de 31( refleja diferencias inherentes al aprendizaje motor. Esta heterogeneidad ha sido documentada en otros estudios, que señalan que variables como las habilidades visoespaciales, la coordinación motora fina y rasgos de personalidad (como la impulsividad), influyen de manera significativa en el desempeño laparoscópico 36. Esta evidencia refuerza la necesidad de adoptar modelos de entrenamiento adaptativo que respondan a las particularidades de cada aprendiz, en lugar de enfoques uniformes basados solo en la cantidad de repeticiones o tiempo de entrenamiento 37.
Los resultados obtenidos muestran que, si bien las tasas de aprobación según los estándares FLS y otras referencias internacionales fueron bajas (20,3-25,9 %), el ajuste de los criterios a estándares locales elevó esta proporción al 36 %, considerando mejoras significativas. Esta discrepancia sugiere que las métricas globales no siempre son aplicables a todos los contextos y que es necesario desarrollar criterios de evaluación que tengan en cuenta las realidades y las limitaciones propias del entorno formativo, como el acceso a simuladores, la disponibilidad de tiempo de práctica y el nivel base de los residentes.
Nuestros hallazgos coinciden con otros estudios en América Latina, donde también se reportó una necesidad de contextualizar los estándares de entrenamiento 6,23. Adicionalmente, se identificó una mejora progresiva en las tasas de aprobación a medida que aumenta el número de intentos, lo cual es esperable en una población en formación. Cabe destacar que los límites temporales de aprobación muestran mayores diferencias en los primeros ejercicios, pero tienden a converger en los ejercicios finales. Esto podría explicarse por el hecho de que los primeros ejercicios representaron el primer acercamiento de muchos residentes a la cirugía laparoscópica, a diferencia de programas internacionales donde la formación en laparoscopia se inicia desde etapas tempranas, incluso durante la educación médica de pregrado 38.
Entre las principales fortalezas de este estudio se destaca que, hasta donde tenemos conocimiento, constituye la primera cohorte local que evalúa de manera sistemática el proceso de adquisición de habilidades laparoscópicas en residentes de Cirugía general, siendo además la más amplia reportada en el contexto colombiano. Se utilizaron ejercicios estandarizados propuestos por el programa FLS, lo que permite una comparación estructurada del desempeño. Asimismo, se aplicaron múltiples criterios de evaluación (incluyendo estándares internacionales, referencias por nivel de formación y umbrales ajustados al contexto local( lo que ofrece una visión más integral y realista del rendimiento técnico. Finalmente, el uso de herramientas estadísticas avanzadas, como las curvas CUSUM y la regresión segmentada, permitió analizar con profundidad tanto el progreso individual como grupal, identificando con precisión los momentos de transición entre aprendizaje, “proficiencia” y competencia.
No obstante, este estudio presenta algunas limitaciones. Al tratarse de una cohorte proveniente de un único centro educativo y con muestreo por conveniencia, los hallazgos podrían tener dificultades para ser generalizados a toda la población. Además, la construcción de los estándares y su evaluación se realizaron sobre la misma cohorte, lo que puede limitar su independencia. Tampoco se consideraron variables individuales que potencialmente influyen en el rendimiento, como la carga de turnos previos, las horas de sueño, la edad, el estrés o la experiencia previa en simulación. Estos aspectos serán abordados en futuras investigaciones, que también explorarán factores predictivos de mejor desempeño y trayectorias de aprendizaje más eficientes.
Conclusiones
El uso de curvas CUSUM permitió identificar con precisión los momentos en que los médicos residentes transitan del aprendizaje a la “proficiencia” y posteriormente a la competencia, aportando una visión clara y secuencial del proceso de adquisición de habilidades quirúrgicas. Esta herramienta no solo mejora la comprensión del progreso técnico, sino que facilita intervenciones educativas oportunas y focalizadas que pueden ser replicadas.
Nuestros hallazgos también destacan la relevancia de adaptar los criterios de evaluación al contexto local. La implementación de estándares ajustados mejoró significativamente las tasas de aprobación, reflejando de forma más realista el desempeño de los residentes y sugiriendo que los parámetros internacionales, como los del programa FLS, pueden no ser plenamente aplicables en todos los entornos. Esta adecuación no implica una reducción en la exigencia técnica, sino una evaluación más justa y contextualizada.
La integración de CUSUM en programas de simulación quirúrgica representa una oportunidad para personalizar la enseñanza, permitiendo que el entrenamiento se centre en el ritmo y necesidades individuales de cada residente. Esta aproximación promueve una educación más eficiente, orientada a resultados concretos y alineada con los retos de la práctica clínica actual. En conjunto, estos hallazgos aportan una base sólida para el diseño de programas de formación más efectivos, dinámicos y adaptados a las realidades de cada institución.
















