Introducción
La aptitud física, un componente de la salud, se evalúa a través de múltiples factores, incluyendo la capacidad aeróbica, la fuerza muscular, la velocidad/agilidad, el equilibrio y la flexibilidad 1. La capacidad aeróbica, en particular, se mide tanto en individuos sanos como en aquellos con diversas condiciones de salud2, y las pruebas para evaluarla se dividen en dos categorías: directas (máximas) e indirectas (submáximas)3. Las pruebas directas, como la ergoespirometría y las pruebas de esfuerzo electrocardiográficas (Bruce, Balke, Naughton)4,5, son consideradas el “estándar de oro” debido a su precisión. Sin embargo, su aplicación en la práctica clínica se ve limitada por la necesidad de equipos especializados, personal entrenado y los costos asociados, lo que restringe su uso en ciertos entornos y poblaciones.
En contraste, las pruebas indirectas, que estiman el consumo máximo de oxígeno (VO₂ máx) mediante fórmulas, ofrecen una alternativa práctica y accesible. Entre estas se incluyen el test step-up6, el test de lanzadera (shuttle walking test)3, el test de caminata de 6 minutos (TC6M)7, el test estacionario de 2 minutos (TE2M)8 y la prueba de pasos YMCA (en inglés, Young Men’s Christian Association)9. Estas pruebas facilitan la prescripción de ejercicio y son relevantes debido a su correlación con eventos cardiovasculares y mortalidad por todas las causas en adultos10.
La evidencia respalda el uso del TC6M en pacientes con enfermedad pulmonar y para la estimación del pronóstico en diversas condiciones clínicas11. Sin embargo, el TC6M presenta limitaciones, como la necesidad de un espacio físico amplio y la capacidad del paciente para deambular. Por lo tanto, TE2M surge como una alternativa para evaluar a personas en espacios reducidos o con dificultades para desplazarse fuera de una habitación10. Además, podría utilizarse como prueba complementaria al TC6M12.
Diversos estudios de reproducibilidad han demostrado la utilidad del TE2M para el monitoreo del estado funcional13 y el pronóstico en condiciones como enfermedad arterial periférica, insuficiencia cardíaca sistólica, fragilidad en personas mayores y obesidad14. También se ha estudiado en insuficiencia cardíaca sistólica15 y en individuos no institucionalizados de la comunidad, con edades entre 18 y 85 años7 . No obstante, son escasas las publicaciones que describen el uso y la reproducibilidad del TE2M en personas sanas, en quienes también podría ser una herramienta confiable para evaluar la capacidad funcional.
Diversos estudios han evaluado la confiabilidad del TE2M en diferentes poblaciones, como personas con osteoartritis de rodilla (ICC ≥ 0,94)16, adultos activos y sedentarios (ICC ≥ 0,83)13 y personas entre 18 y 85 años (ICC ≥ 0,82)7 . Sin embargo, la confiabilidad del TE2M no se ha investigado en personas sin enfermedades, lo que limita su uso.
Es importante evaluar las propiedades psicométricas de un instrumento para garantizar la calidad de su medición17. Según los criterios de la lista de chequeo Consensus-based Standards for the Selection of Health Measurement Instruments (COSMIN)18, la confiabilidad se refiere a la estabilidad y precisión de una prueba o instrumento al obtener mediciones consistentes en condiciones similares19, asegurando que los resultados reflejen fielmente la variable medida y no sean producto del azar. Por lo tanto, el objetivo de este estudio fue analizar la confiabilidad (intra e interevaluador y test-retest) del TE2M en personas sanas entre 18 y 69 años en una ciudad del suroccidente colombiano.
Metodología
Población de estudio
Para el cálculo del tamaño muestral se siguieron las directrices de la guía COSMIN18. Se incluyeron 101 participantes entre 18 y 69 años, residentes del área urbana de la ciudad de Popayán (al sur occidente de Colombia, a una altura de 1700 metros sobre el nivel del mar). Se excluyeron aquellos con deterioro cognitivo (puntaje<13 en el Mini-Mental State Examination (MMSE))20, problemas para adoptar y mantener la posición bípeda o que presentaran algún diagnóstico por alguna situación de enfermedad (índice de Charlson)21 y personas bajo el efecto de sustancias psicoactivas.
Reclutamiento
Para la convocatoria de los participantes, se aprovecharon los medios de comunicación y se realizó contacto directo con personas de la comunidad, quienes recibieron información sobre el estudio. A los que aceptaron participar, se les contactó para definir el día de la prueba y recibieron una serie de recomendaciones previas a la realización de las mediciones, que incluyen: no haber realizado actividad física en las 12 horas previas al examen, no haber fumado cigarrillo las 12 horas previas al examen y llevar ropa cómoda.
Variables e instrumentos de medida
El TE2M, también conocido como el “minute step test”, es un componente de la batería Senior Fitness Test. La prueba se administró siguiendo las directrices establecidas por Rikli y Jones8. El procedimiento consistió en solicitar al participante que marchara en el lugar, sin desplazamiento, elevando las rodillas hasta un punto medio entre la rótula (centro) y la cresta ilíaca anterosuperior (borde superior de la cadera). Esta altura se determinó mediante una cinta métrica. Se registró el número de veces que la rodilla derecha alcanzó la altura establecida durante un período de dos minutos.
El protocolo del test incluyó las siguientes estandarizaciones: no se realizó calentamiento previo; se utilizaron los comandos verbales “ahora” para iniciar y “deténgase” para finalizar; solo se contabilizó la elevación de la rodilla derecha, aunque ambas rodillas debían alcanzar la altura establecida; si el participante disminuía la velocidad o no alcanzaba la altura requerida, se le indicaba que ajustara su ritmo, sin detener el cronómetro; para mantener el ritmo, se proporcionaron indicaciones verbales al minuto (“va a mitad de la prueba, falta 1 minuto”) y al minuto y medio (“le falta 30 segundos para terminar la prueba”); y al completar los dos minutos, se indicó la finalización con el comando “deténgase”.
El resultado de la prueba se determinó por el número total de pasos completos realizados en dos minutos. Tras un descanso de 15 minutos, se repitió la prueba siguiendo el mismo protocolo y manteniendo los mismos evaluadores
Confiabilidad
La medición de reproducibilidad fue llevada a cabo por dos fisioterapeutas especialistas en fisioterapia cardiopulmonar capacitados en la aplicación del TE2M. Previamente, se realizó una prueba piloto con 10 personas de características similares a la muestra, con el fin de realizar los ajustes pertinentes. El tiempo aproximado para la aplicación del TE2M fue de 45 minutos.
Antes de realizar el primer TE2M, se presentó un video instructivo al participante para familiarizarlo con el procedimiento del test. Posteriormente, se registraron las mediciones antropométricas (peso y talla) siguiendo las directrices de la Organización Mundial de la Salud (OMS). Estas mediciones se obtuvieron con una báscula calibrada y un estadiómetro de la marca SECA®, con una precisión de 0.5 cm.
En la primera prueba, el evaluador 1 dirigió la ejecución del test, mientras que el evaluador 2 observó todo el proceso. Las mediciones se realizaron el mismo día, con un intervalo de 30 minutos entre ellas. Los formatos de registro del número de pasos fueron diligenciados de manera independiente, sin comunicación entre los evaluadores. Además, el evaluador 2 fue responsable de registrar la información del cuestionario auto diligenciado, el cual incluía las siguientes variables: edad, sexo, estado civil, estrato socioeconómico (ESE) de la vivienda, nivel de escolaridad, percepción del estado de salud (mala, regular, muy buena, excelente)22, nivel de actividad física (registrado a partir de una pregunta directa sobre el tiempo dedicado a actividades físicas y posteriormente recategorizado en “sí” o “no”, según las recomendaciones mínimas de actividad física)23, índice de masa corporal (IMC), clasificado como normal (18,5-24,9), bajo peso (<18,5), sobrepeso (≥25) y obesidad24, (≥30), y el número de pasos obtenidos en la prueba TE2M.
Se registraron todos los signos vitales al inicio y al final de la prueba. Posterior a la realización del primer test, el participante descansó durante 30 minutos antes de realizar la segunda prueba, manteniéndose los mismos roles para los evaluadores.
Para evaluar la reproducibilidad test-re test, los participantes fueron citados nuevamente a los siete días para repetir el procedimiento, intercambiando los roles de evaluador y observador asumidos en la primera prueba. En el segundo TE2M, se siguieron los mismos lineamientos establecidos en el protocolo.
Finalmente se analizó el nivel de acuerdo entre las mediciones a evaluadores e inter-evaluadores para determinar cuán cercanos son los valores obtenidos entre mediciones y obtener una diferencia real entre ellas.
Otro investigador enmascarado, se encargó de organizar la información recolectada en los datos a la base en Excel.
Recolección y análisis de datos
Este estudio de propiedades psicométricas se basó en las metodología COSMIN18. La información se recogió entre octubre y diciembre del año 2023.
Consideraciones éticas
El estudio fue aprobado por el Comité de Ética de la Universidad del Valle, Colombia (acta de aprobación No. 229- 019), siguiendo los principios de la Declaración de Helsinki. Al inicio de la prueba TE2M, todos los participantes firmaron un consentimiento informado, del cual recibieron una copia. Para garantizar la confidencialidad de la información, a cada participante se le asignó un código único.
Análisis estadístico
Se aplicaron medidas descriptivas con frecuencias absolutas y relativas. Se evaluó la normalidad de estas mediante la prueba Shapiro Wilk, por lo que se reportan los datos con media y desviación estándar. Por medio del Coeficiente de Correlación Intraclase (ICC) 25 y bajo un modelo aleatorio bidireccional, se determinó la reproducibilidad del TE2M, con Intervalo de Confianza (IC) de 95%. La interpretación del ICC se basó en el estudio de Fleiss 26: la reproducibilidad fue de <0,40= baja; de 0,40 a 0,74= moderada; de 0,75 a 0,90= sustancial; > 0,90 = excelente. El método de Bland-Altman, determinó los límites de concordancia (límites superior e inferior de concordancia) entre los resultados comparados. Los datos se presentaron como media y desviación estándar. Los datos fueron procesados en el software libre Jamovi 2.3.28, con un nivel de significancia del 5% en todos los análisis
Resultados
Se realizaron mediciones a 101 personas sanas; de los cuales más de la mitad eran hombres; con relación a la edad 24,80% estaban entre 18-29 años, seguido de un 22,80% entre 50-59 años; estado civil soltero en 49,50%; escolaridad de técnico o superior del 48,50%, estrato socioeconómico (ESE) de la vivienda medio fue de 58,40%. Según las condiciones de salud, para el estado de salud cerca del 96% tuvo entre (excelente, muy buena y buena). Tabla 1.
Tabla 1 Características sociodemográficas y condiciones de salud en personas de 18 a 69 años de Popayán
| Características | Total |
|---|---|
| Sociodemográficas | (n=101)(%) |
| Sexo | |
| Hombre | 51(50,50) |
| Mujer | 50(49,50) |
| Edad | |
| 18-29 | 25(24,80) |
| 30-39 | 17(16,80) |
| 40-49 | 19(18,80) |
| 50-59 | 23(22,80) |
| 60-69 | 17(16,80) |
| Estado civil | |
| Soltero | 50(49,50) |
| Casado-Unión libre | 42(41,60) |
| Separado-Divorciado | 8(7,90) |
| Viudo | 1(1,00) |
| Escolaridad | |
| Primaria | 10(9,90) |
| Secundaria | 15(14,90) |
| Técnico o superior | 49(48,50) |
| Posgrado | 27(26,70) |
| ESE vivienda | |
| Bajo | 33(32,70) |
| Medio | 59(58,40) |
| Alto | 9(8,90) |
| Condiciones de Salud | |
| Estado de salud | |
| Excelente | 16(15,80) |
| Muy buena | 30(29,70) |
| Buena | 51(50,50) |
| Regular | 4(4,00) |
| Mala | 0(0,00) |
| Actividad Física | |
| Si | 59(58,40) |
| No | 42(41,60) |
| IMC(kg/m2) | |
| Normal | 38(37,60) |
| Sobrepeso | 48(47,50) |
| Obesidad | 15(14,90) |
ESE: Estrato socioeconómico. IMC: índice de masa corporal
Para el primer test (Ft1), el evaluador X1 obtuvo 116 ± 19,10 pasos, y el evaluador X2 obtuvo 121 ± 18,00 pasos. Para el segundo test (Ft2), los resultados fueron 116 ± 19,10 pasos para el evaluador X1 y 120 ± 18,40 pasos para el evaluador X2. Se identificó una excelente reproducibilidad entre e intra evaluadores, con ICC ≥ 0,98. Los valores específicos de ICC se detallan en la Tabla 2.
Tabla 2 Reproducibilidad del test de marcha estacionario de 2 minutos
| Pareja/rol | Medición 1 TE2 | p | Medición 2 TE2M | p | ||
| ICC | IC95% | ICC | IC95% | |||
| Entre-evaluadores | ||||||
| Ft1.Evaluador- Ft2.Evaluador | 0,995 | (0,99-0,99) | <.000 | 0,995 | (0,99-0,99) | <.000 |
| Ft2.Observador- Ft1.Observador | 0,987 | (0,98-0,99) | <.000 | 0,987 | (0,98-0,98) | <.000 |
| Intra-evaluadores | ||||||
| Ft1.Evaluador -Ft1 Observador | 0,900 | (0,86-0,93) | <.000 | 0,900 | (0,86-0,93) | <.000 |
| Ft2.Observador- Ft2 Evaluador | 0,893 | (0,85-0,92) | <.000 | 0,893 | (0,85-0,92) | <.000 |
TE2M: test de marcha estacionaria de 2 minutos. ICC: Coeficiente de Correlación Intraclase. IC95%: Intervalo de confianza al 95%
El análisis de Bland-Altman mostró altos niveles de concordancia entre e intra evaluadores (Figura 1) Y revelaron los siguientes datos:
(a)Test-retest: Sesgo = -3,19 (IC 95% = -5,51 a -0.86); LIA = -26,26 (IC 95% = -30,24 a -22,27); LSA = 19,88 (IC 95% = 15,90 a 23,86), con un 7% de los valores fuera de los límites de acuerdo.
(b)Entre evaluadores: Sesgo = -0,337 (IC 95% = -0,88 a -0,21); LIA = -5,76 (IC 95% = -6,69 a -4,82); LSA = 5,08 (IC 95% = 4,15 a 6,02), con un 6% de los valores fuera de los límites de acuerdo.
(c)Intra-evaluador 1: Sesgo = -2,78 (IC 95% = -4,99 a 0.57); LIA = -24,7 (IC 95% = -27,19 a -22,19); LSA = 19,12 (IC 95% = 16,63 a 21.62), con un 6% de los valores fuera de los límites de acuerdo.
(d)Intra-evaluador 2: Sesgo = 3,19 (IC 95% = 0.86 a 5,51); LIA = -19,88 (IC 95% = -23,86 a -15,90); LSA = 26,26 (IC 95% = 22,27 a 30,24), con un 5% de los valores fuera de los límites de acuerdo.
Todos los gráficos mostraron límites de acuerdo estrechos y la línea de igualdad (línea azul) se mantuvo dentro de los límites de confianza de la media en cada gráfico.
Discusión
El objetivo de este estudio fue evaluar la confiabilidad del TE2M en personas sanas de 18 a 69 años en una ciudad del suroccidente colombiano. Los resultados demostraron una excelente confiabilidad entre e intra evaluadores. Los autores consideran que la información obtenida en esta investigación puede ser útil para los profesionales de la rehabilitación, tanto para la evaluación complementaria del estado funcional27,28, como para la prescripción de ejercicio en individuos sanos29.
La evidencia sobre las propiedades de confiabilidad del TE2M en personas sanas es limitada. Tanto Rikli y Jones8 como el presente estudio reportan una excelente confiabilidad, consistente con otras publicaciones sobre el TE2M que muestran valores de ICC ≥ 0,907,13,30. También se ha reportado una excelente reproducibilidad test- retest en individuos con osteoartritis de rodilla16. El TE2M se ha utilizado para evaluar la capacidad aeróbica en diversas poblaciones7,30,31 y se sugiere como una herramienta para evaluar los sistemas cardiopulmonar y musculoesquelético29, así como la capacidad funcional7. Además, se propone como una medición complementaria al TC6M12. Este test representa una alternativa válida para personas con dificultades para caminar o que no disponen de espacios amplios para realizar pruebas, siendo particularmente útil en adultos mayores. La alta reproducibilidad observada puede explicarse por la precisión inherente de la variable medida y su baja variabilidad, lo que reduce el coeficiente de variación, como también a la estandarización del protocolo y el entrenamiento de los evaluadores lo que minimizan la variabilidad en las mediciones, y contribuye a la alta confiabilidad
En estudios previos de intervención, se han establecido diferencias entre los valores para el número de pasos (entre 12 y 24) de forma significativa 14,16,28,32,33, pero estos valores no son puntos de comparación debido a que no son puntos de corte establecidos, sin embargo para este estudio se presentó un hallazgo en el que se encontró una variación de 20 a 25 pasos, lo que puede estar dador por un error en la medición, situación que puede ser considerada como una limitante del estudio28. Por lo anterior se sugiere realizar la prueba al menos dos veces, similar a la recomendación de la Sociedad Americana del Tórax para el TC6M34, igualmente, es posible que se desarrolle con al menos media hora entre los test, y se dejen los mejores resultados de prueba, establecer un patrón de referencia para hacer el comparativo.
El TE2M fue propuesto originalmente como parte de una batería de pruebas de aptitud física para adultos mayores35. En este estudio, se evaluó su aplicabilidad en participantes con menores rangos de edad, demostrando que es una prueba reproducible y confiable en personas sanas de 18 a 69 años.
Dada la alta confiabilidad observada, se sugiere realizar estudios adicionales para evaluar la validez, y capacidad de respuesta del TE2M en otros contextos y poblaciones. Esto permitiría establecer valores de referencia normativos para el TE2M.
El TE2M se presenta como una excelente opción para evaluar la capacidad aeróbica, superando limitaciones de espacio, equipos y tiempo. Los datos de referencia obtenidos podrían servir de base para futuros estudios comparativos entre el TE2M y otras pruebas, como la ergoespirometría y el TC6M, en diversos grupos poblacionales7,8,13,16.
La lista de verificación COSMIN18 enfatiza la importancia de seleccionar un intervalo de tiempo adecuado entre mediciones y de mantener condiciones de prueba similares en ambos momentos. En este estudio, se optó por un intervalo de 7 días y se aplicó el mismo protocolo en ambas evaluaciones, lo que fortalece la validez de los resultados
Las fortalezas metodológicas de este estudio están relacionadas con la definición de los roles de evaluador y observador, la aplicación del mismo protocolo para minimizar discrepancias, y la implementación de estrategias para reducir el sesgo de información. Estas estrategias incluyeron el uso de un video educativo y el dispositivo “T2”, diseñado para estandarizar la prueba y evitar factores que pudieran afectar la realización del TE2M
En este estudio, la reproducibilidad inter evaluador y test-retest se evaluó mediante mediciones realizadas por una pareja de fisioterapeutas especialistas en fisioterapia cardiopulmonar. Los evaluadores alternaron los roles de observador y evaluador para la confiabilidad test-retest, y realizaron las mediciones sin conocer las puntuaciones previas.
Los autores consideran que la alternancia de roles contribuyó a minimizar los sesgos relacionados con la administración de comandos, un factor que puede variar entre profesionales e influir en los resultados. Los resultados demostraron una alta concordancia y ausencia de diferencias entre los roles de observador y evaluador en ambos momentos de medición. Este hallazgo puede atribuirse al entrenamiento estandarizado de los evaluadores y a su experiencia clínica
Los autores reconocen que una de las limitaciones del estudio es la escasez de publicaciones sobre las propiedades psicométricas del TE2M en poblaciones sanas y en diferentes grupos de edad, lo que dificulta la discusión de los resultados. También, que no hubo correlación con otra prueba que permitirá comprar la medición de la capacidad funcional. Además, se considera necesario incluir una muestra más amplia que abarque un rango de edad mayor para observar el comportamiento del test en diversos rangos de edad al igual que su variabilidad.
Se sugiere que futuros estudios con alta calidad metodológica evalúen otras propiedades psicométricas del TE2M, como la validez convergente con el TC6M en personas sanas, para obtener conclusiones más sólidas sobre las características de esta prueba.
Conclusión
El TE2M demostró una excelente reproducibilidad. La alta concordancia y precisión observadas entre e intra evaluadores, a través de diferentes tiempos y examinadores, respaldan su confiabilidad. Esto sugiere que el TE2M puede ser utilizado como una prueba complementaria al TC6M. Además, su fácil aplicación y la mínima necesidad de insumos lo convierten en una herramienta práctica para evaluar la capacidad funcional en personas sanas















