Scielo RSS <![CDATA[Revista Facultad de Ingeniería]]> http://www.scielo.org.co/rss.php?pid=0121-112920250003&lang=en vol. 34 num. 73 lang. en <![CDATA[SciELO Logo]]> http://www.scielo.org.co/img/en/fbpelogp.gif http://www.scielo.org.co <![CDATA[EXPLORING THE IMPACT OF A PERSUASIVE APP (PERSUDRINK 50+) TO PROMOTE HYDRATION IN MIDDLE-AGED ADULTS: DESIGN AND PILOT TEST]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0121-11292025000300001&lng=en&nrm=iso&tlng=en ABSTRACT Adequate daily hydration is essential for optimal health, yet one third of adults worldwide fail to meet recommended water intake. The risk is especially pronounced among adults aged 50-65, who record the lowest consumption and are at increased risk of dehydration related complications affecting digestive, respiratory, nervous systems, among others. Although several mobile interventions have been made to promote fluid intake, only a few employ evidence-based persuasive strategies or are tailored to the specific habits and motivations of middle-aged adults. This study introduces PersuDrink 50+, a persuasive mobile application designed for healthy individuals aged 50-65 to improve hydration behaviors. The app integrates goal setting, real time feedback, and personalized reminders grounded in the Persuasive Systems Design framework. A three-day pilot with six participants (mean age = 57 ± 2.73 years) evaluated its impact on knowledge of hydration benefits, attitudes toward drinking water, perceived self-control, intention to increase intake, and actual consumption. Pre- and post-intervention surveys measured these constructs, while the app’s built-in tracker logged daily fluid volume. Results demonstrated gains across all outcomes: knowledge scores rose from 1.4 to 3.0, perceived control from 5.75 to 8.10, attitudes from 7.36 to 9.28, and intention from 6.33 to 8.63. Correspondingly, participants increased or decreased their daily water intake to align with the WHO recommendation of ≥2 L/day. While the small sample and short test time do not enable generalizing about it, these preliminary findings suggest that PersuDrink 50+ enhances hydration knowledge and motivation in a short time frame. Future work will involve a larger randomized controlled trial and extended test time and follow up to assess the long-term effectiveness of the system.<hr/>RESUMEN Una hidratación diaria adecuada es esencial para una salud óptima; sin embargo, un tercio de los adultos en todo el mundo no alcanza los niveles recomendados de ingesta de agua. El riesgo es especialmente pronunciado en adultos entre 50 y 65 años, quienes registran el consumo más bajo y corren un mayor riesgo de sufrir complicaciones relacionadas con la deshidratación que afectan, entre otros, a los sistemas digestivo, respiratorio y nervioso. Aunque existen varias intervenciones móviles para promover la ingesta de líquidos, pocas emplean estrategias persuasivas basadas en la evidencia o se adaptan a los hábitos y motivaciones específicos de los adultos de mediana edad. Este estudio presenta PersuDrink 50+, una aplicación móvil persuasiva diseñada específicamente para personas sanas entre 50 y 65 años con el fin de mejorar sus hábitos de hidratación. La aplicación integra el establecimiento de objetivos, comentarios en tiempo real y recordatorios personalizados basados en el marco de diseño de sistemas persuasivos. Una prueba piloto de tres días con seis participantes (media de edad = 57 ± 2,73 años) evaluó su impacto en el conocimiento de los beneficios de la hidratación, las actitudes hacia el consumo de agua, el autocontrol percibido, la intención de aumentar la ingesta y el consumo real. Las encuestas previas y posteriores a la intervención midieron estos constructos, mientras que el rastreador integrado en la aplicación registró el volumen diario de líquidos. Los resultados demostraron mejoras en todos los aspectos: las puntuaciones de conocimiento aumentaron de 1,4 a 3,0, el control percibido de 5,75 a 8,10, las actitudes de 7,36 a 9,28 y la intención de 6,33 a 8,63. En consecuencia, los participantes aumentaron o disminuyeron su ingesta diaria de agua para ajustarse a la recomendación de la OMS de ≥2 l/día. Aunque la pequeña muestra y la breve duración de la prueba limitan la generalización, estos resultados preliminares sugieren que PersuDrink 50+ mejora los conocimientos y la motivación en materia de hidratación en un breve periodo de tiempo. En el futuro, se llevará a cabo un ensayo controlado aleatorio más amplio y se prolongará la duración de la prueba con un seguimiento más extenso para evaluar la eficacia a largo plazo del sistema.<hr/>RESUMO A hidratação diária adequada é essencial para uma saúde ideal; no entanto, um terço dos adultos em todo o mundo não atinge os níveis recomendados de ingestão de água. O risco é particularmente elevado entre adultos de 50 a 65 anos, que apresentam o menor consumo e maior probabilidade de sofrer complicações relacionadas à desidratação que afetam, entre outros, os sistemas digestivo, respiratório e nervoso. Embora existam diversas intervenções móveis para promover a ingestão de líquidos, poucas utilizam estratégias persuasivas baseadas em evidências ou se adaptam aos hábitos e motivações específicos dos adultos de meia-idade. Este estudo apresenta o PersuDrink 50+, um aplicativo móvel persuasivo desenvolvido especificamente para pessoas saudáveis entre 50 e 65 anos, com o objetivo de melhorar seus hábitos de hidratação. O aplicativo integra definição de metas, feedback em tempo real e lembretes personalizados baseados no modelo de design de sistemas persuasivos. Um teste piloto de três dias com seis participantes (idade média = 57 ± 2,73 anos) avaliou o impacto do aplicativo no conhecimento sobre os benefícios da hidratação, nas atitudes em relação ao consumo de água, no autocontrole percebido, na intenção de aumentar a ingestão e no consumo real. Questionários aplicados antes e depois da intervenção mediram esses constructos, enquanto o rastreador integrado no aplicativo registrou o volume diário de líquidos. Os resultados mostraram melhorias em todos os aspectos: as pontuações de conhecimento aumentaram de 1,4 para 3,0; o controle percebido, de 5,75 para 8,10; as atitudes, de 7,36 para 9,28; e a intenção, de 6,33 para 8,63. Consequentemente, os participantes ajustaram seu consumo diário de água para atender à recomendação da OMS de ≥ 2 L/dia. Embora o pequeno tamanho da amostra e a curta duração do teste limitem a generalização, esses resultados preliminares sugerem que o PersuDrink 50+ melhora o conhecimento e a motivação relacionados à hidratação em um curto período de tempo. Futuramente, será realizado um ensaio clínico randomizado mais amplo, com maior duração e acompanhamento prolongado, para avaliar a eficácia de longo prazo do sistema. <![CDATA[MANAGING HIGH TURNOVER IN SOFTWARE DEVELOPMENT THROUGH SELF-MENTORING: A STRUCTURED APPROACH BASED ON ISO/IEC 29110 AND AGILE PRACTICES IN STUDENT INTERNSHIPS]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0121-11292025000300002&lng=en&nrm=iso&tlng=en ABSTRACT High staff turnover presents a persistent challenge in the software development industry, often resulting in low productivity, loss of knowledge, and disruption of workflows. This issue becomes even more critical in settings with professional training programs for students. This paper proposes a structured self-mentoring model to mitigate the negative effects of high turnover, wherein experienced interns guide new interns, ensuring knowledge transfer and workflow stability. The approach was implemented over five internship cycles, combining the ISO/IEC 29110 standard with agile methods to support continuous development, maintain project continuity, and foster growth in both technical and soft skills. The results of project data analysis across cycles indicate improvements in productivity, quality, and participation, accompanied by a significant reduction in rework during peak performance cycles. This model demonstrates that even in high-turnover environments, structured practices can sustain quality software development while enriching students’ learning experiences.<hr/>RESUMEN La alta rotación en personal representa un desafío constante en la industria del desarrollo de software, que a menudo resulta en una baja productividad, la pérdida de conocimiento y la interrupción en el flujo de trabajo. Problema que se agrava aún más en entornos con programas de formación profesional para estudiantes. Este documento propone un modelo estructurado de auto tutoría para mitigar los efectos negativos de la alta rotación, en el que los pasantes con experiencia guían a los nuevos pasantes, garantizando la transferencia de conocimientos y la estabilidad del flujo de trabajo. El enfoque se implementó a lo largo de cinco ciclos de prácticas, combinando la norma ISO/IEC 29110 con métodos ágiles para apoyar el desarrollo continuo, mantener la continuidad del proyecto y fomentar el desarrollo de habilidades técnicas y personales. Los resultados del análisis de datos del proyecto a lo largo de los ciclos indican mejoras en la productividad, calidad y participación, acompañados de una reducción significativa de la repetición del trabajo durante los ciclos de máximo rendimiento. Este modelo demuestra que, incluso en entornos de alta rotación, las prácticas estructuradas pueden sustentar un desarrollo de software de calidad, a la vez que enriquecen las experiencias de aprendizaje de los estudiantes.<hr/>RESUMO A alta rotatividade de pessoal representa um desafio constante na indústria de desenvolvimento de software, resultando frequentemente em baixa produtividade, perda de conhecimento e interrupções no fluxo de trabalho - problema que se agrava ainda mais em ambientes com programas de formação profissional para estudantes. Este trabalho propõe um modelo estruturado de auto-tutoria para mitigar os efeitos negativos da alta rotatividade, no qual estagiários experientes orientam os novos, garantindo a transferência de conhecimento e a estabilidade do fluxo de trabalho. A abordagem foi implementada ao longo de cinco ciclos de estágio, combinando a norma ISO/IEC 29110 com métodos ágeis para apoiar o desenvolvimento contínuo, manter a continuidade do projeto e promover o desenvolvimento de competências técnicas e interpessoais. Os resultados da análise dos dados do projeto ao longo dos ciclos indicam melhorias na produtividade, na qualidade e no engajamento, acompanhadas de uma redução significativa da repetição de tarefas durante os ciclos de maior desempenho. O modelo demonstra que, mesmo em ambientes de alta rotatividade, práticas estruturadas podem sustentar um desenvolvimento de software de qualidade, ao mesmo tempo em que enriquecem as experiências de aprendizagem dos estudantes. <![CDATA[DATA ANALYTICS MODEL OF THE ACCESSIBILITY-VULNERABILITY RELATIONSHIP: RISK SCENARIOS IN URBAN AREAS]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0121-11292025000300003&lng=en&nrm=iso&tlng=en ABSTRACT A clustering model that examines the relationship between accessibility and vulnerability was proposed. The aim was to observe spatial accessibility variables through urban public transportation and assess the vulnerability of the population in urban areas. This model was tested in the context of the COVID-19 pandemic in the city of Cali. A hierarchical agglomerative clustering analysis was conducted on 22 communes in Cali, Colombia, at three different points in time. The Shapiro-Wilk test was used to assess the normality of the data grouped into the obtained profiles. The model identifies homogeneous groups and defines the zones of concern within the city of Cali. These zones provide insight into the risk scenario regarding accessibility-vulnerability profiles, including access to essential services such as healthcare and food for various population groups (more vulnerable or less vulnerable). The results revealed a new zoning of the city of Cali within the context of the COVID-19 pandemic risk scenario. The accessibility-vulnerability profiles were automatically identified, supporting strategic decision-making processes related to public policies, risk management, and land use management. New zoning of the city enables targeted attention to each area based on its specific characteristics, thereby addressing the complexity of the problem.<hr/>RESUMEN Se propone la construcción de un modelo de agrupamiento automático de la relación accesibilidad-vulnerabilidad. Específicamente, se busca observar las variables de accesibilidad espacial a través del transporte público urbano y la vulnerabilidad de la población en una ciudad. El modelo se probó para el escenario de riesgo de la pandemia de COVID-19 en la ciudad de Cali. Por lo anterior, se llevó a cabo un análisis de clustering aglomerativo jerárquico en 22 comunas de la ciudad de Cali, Colombia, en tres momentos temporales. Se evaluó la distribución de los indicadores en cada grupo, utilizando la prueba de Shapiro-Wilk, para contrastar la normalidad de los datos agrupados en los perfiles obtenidos. El modelo permite identificar grupos homogéneos y definir zonas de atención en la ciudad. Estas zonas ofrecen un entendimiento del escenario de riesgo en términos de perfiles de accesibilidad-vulnerabilidad: acceso en transporte público a equipamientos esenciales como el sistema de salud y alimentos para diferentes grupos de población (más vulnerables o menos vulnerables). Los resultados revelan una nueva zonificación de la ciudad de Cali en el escenario de riesgo de la pandemia de COVID-19 los cuales se muestran mediante representación cartográfica. Se identificaron automáticamente perfiles de accesibilidad-vulnerabilidad. Estos resultados apoyan los procesos de toma de decisiones estratégicas, particularmente los relacionados con políticas públicas, gestión de riesgos y gestión del uso del suelo a partir de variables relevantes. La nueva zonificación de la ciudad permite atender de forma específica cada zona de acuerdo a sus características intrínsecas, logrando así gestionar la complejidad del problema.<hr/>RESUMO Propõe-se a construção de um modelo de agrupamento automático da relação acessibilidade-vulnerabilidade. Especificamente, busca-se observar as variáveis de acessibilidade espacial por meio do transporte público urbano e a vulnerabilidade da população em uma cidade. O modelo foi testado para o cenário de risco da pandemia de COVID-19 na cidade de Cali. Para isso, realizou-se uma análise de clustering aglomerativo hierárquico em 22 comunas da cidade de Cali, Colômbia, em três momentos temporais. Avaliou-se a distribuição dos indicadores em cada grupo utilizando o teste de Shapiro-Wilk, a fim de verificar a normalidade dos dados agrupados nos perfis obtidos. O modelo permite identificar grupos homogêneos e definir zonas de atenção na cidade. Essas zonas oferecem um entendimento do cenário de risco em termos de perfis de acessibilidade-vulnerabilidade: acesso por transporte público a equipamentos essenciais, como o sistema de saúde e alimentos, para diferentes grupos populacionais (mais vulneráveis ou menos vulneráveis). Os resultados revelam uma nova zonificação da cidade de Cali no cenário de risco da pandemia de COVID-19, apresentada por meio de representação cartográfica. Perfis de acessibilidade-vulnerabilidade foram identificados automaticamente. Esses resultados apoiam os processos de tomada de decisão estratégica, particularmente aqueles relacionados a políticas públicas, gestão de riscos e gestão do uso do solo com base em variáveis relevantes. A nova zonificação da cidade permite atender especificamente cada zona de acordo com suas características intrínsecas, possibilitando assim gerir a complexidade do problema. <![CDATA[PREDICTING STUDENT DROPOUT RISK IN HIGHER EDUCATION: A MACHINE LEARNING APPROACH]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0121-11292025000300004&lng=en&nrm=iso&tlng=en ABSTRACT Recently, student dropout has been a major challenge for higher education institutions, since high dropout rates generate negative consequences, both academic and social, as well as economic losses for all involved. For these reasons, this study proposes a machine learning-based approach for the early prediction of dropout risk, based on academic, socioeconomic, and demographic variables. The methodology started with an exploratory data analysis, followed by a class balancing of the dataset using the SMOTE technique. Subsequently, supervised classification algorithms such as Support Vector Machines (SVM), XGBoost, Random Forest, and Balanced Random Forest Classifier were trained to build the prediction models. GridSearchCV was used to search for the best hyperparameters. The models were evaluated using metrics robust to class imbalance, such as recall, ROC-AUC curve, geometric mean (G-Mean), precision, and F1-Score. The best-performing models were Random Forest and its Balanced Random Forest Classifier variant, without hyperparameter optimization, with AUC values of 0.94 and recall values greater than 0.8 in the positive class (at-risk students). In addition, model explanation with SHAP values was used to identify and analyze the most influential risk factors (academic and socioeconomic characteristics).<hr/>RESUMEN Recientemente la deserción estudiantil ha venido representando grandes desafíos para las instituciones de educación superior, ya que las altas tasas de deserción generan consecuencias negativas, tanto académicas como sociales, así como pérdidas económicas para todos los involucrados. Por tales motivos, este estudio propone un enfoque basado en aprendizaje automático para la predicción temprana del riesgo de deserción, a partir de variables académicas, socioeconómicas y demográficas. Se propone una metodología que inicia con un análisis exploratorio de los datos seguido de un balanceo de las clases del conjunto de datos mediante la técnica de SMOTE. Posteriormente se entrenan los algoritmos de clasificación supervisada como, Support Vector Machines (SVM), XGBoost, Random Forest y Balanced Random Forest Classifier para la construcción de los modelos de predicción. Para la búsqueda de los mejores hiperparámetros se utilizó la técnica de búsqueda en malla (GridSearchCV). Los modelos fueron evaluados considerando métricas robustas al desbalance de clases, como el recall, la curva ROC-AUC, la media geométrica (G-Mean), precisión y F1-Score. Los modelos que mejor desempeño obtuvieron fueron Random Forest y su variante Balanced Random Forest Classifier, sin optimización de hiperparámetros con valores de AUC de 0.94 y recall superiores al 0.8 en la clase positiva (estudiantes en riesgo). Además, se utilizó la explicación de modelos con valores SHAP para identificar y analizar los factores de riesgo más influyentes (características académicas y socioeconómicas).<hr/>RESUMO Recentemente, a evasão estudantil tem representado grandes desafios para as instituições de ensino superior, pois as altas taxas de abandono geram consequências negativas, tanto acadêmicas quanto sociais, além de perdas econômicas para todos os envolvidos. Por esse motivo, este estudo propõe uma abordagem baseada em aprendizado de máquina para a predição precoce do risco de evasão, a partir de variáveis acadêmicas, socioeconômicas e demográficas. Propõe-se uma metodologia que inicia com uma análise exploratória dos dados, seguida do balanceamento das classes do conjunto de dados por meio da técnica SMOTE. Posteriormente, são treinados algoritmos de classificação supervisionada, como Support Vector Machines (SVM), XGBoost, Random Forest e Balanced Random Forest Classifier, para a construção dos modelos de predição. Para a busca dos melhores hiperparâmetros, utilizou-se a técnica de busca em grade (GridSearchCV). Os modelos foram avaliados considerando métricas robustas ao desbalanceamento de classes, como recall, curva ROC-AUC, média geométrica (G-Mean), precisão e F1-Score. Os modelos que apresentaram melhor desempenho foram Random Forest e sua variante Balanced Random Forest Classifier, sem otimização de hiperparâmetros, com valores de AUC de 0,94 e recall superiores a 0,8 na classe positiva (estudantes em risco). Além disso, utilizou-se a explicação dos modelos com valores SHAP para identificar e analisar os fatores de risco mais influentes (características acadêmicas e socioeconômicas). <![CDATA[EFFORT ESTIMATION IN SOFTWARE DEVELOPMENT PROJECTS USING SUPERVISED MACHINE LEARNING TECHNIQUES]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0121-11292025000300005&lng=en&nrm=iso&tlng=en ABSTRACT This paper presents the results of a research project focused on effort estimation in software development using supervised machine learning techniques. To structure the analysis process, the CRISP-DM methodology was adopted, given that it is recognized for its comprehensive approach and wide acceptance in data mining. The study was based on a dataset provided by the International Software Benchmarking Standards Group (ISBSG), to which rigorous cleaning, transformation, and variable selection procedures were applied. Four effort categories were defined, and key variables for their classification were identified, including the functional size of the software, team productivity, programming language, and the implementation platform. Eight predictive models were developed using representative supervised learning algorithms: AdaBoost, Decision Trees, Random Forests, SVM, Multilayer Perceptron, KNN, Naive Bayes, and Logistic Regression. Their evaluation was carried out using metrics such as the F1-score, MCC, ROC-AUC, Gini index, accuracy, and standard deviations to assess performance and stability. The results show that tree-based models, particularly Random Forest, offer superior performance, achieving an accuracy of 80%. It is concluded that having systematized and high-quality data is fundamental for building reliable predictive models. As future work, the study proposes examining additional ensemble configurations, incorporating new algorithms, and using updated versions of the ISBSG repository.<hr/>RESUMEN Este artículo presenta los resultados de un proyecto de investigación orientado a estimar el esfuerzo en proyectos de desarrollo de software mediante técnicas supervisadas de aprendizaje automático. El análisis se desarrolló siguiendo la metodología CRISP-DM, reconocida por su enfoque estructurado y amplia aceptación en minería de datos. El estudio utilizó el conjunto de datos del International Software Benchmarking Standards Group (ISBSG), al cual se aplicaron rigurosos procesos de limpieza, transformación y selección de variables. Se definieron cuatro categorías de esfuerzo y se identificaron variables clave para su clasificación, como el tamaño funcional del software, la productividad del equipo, el lenguaje de programación y la plataforma de implementación. Se construyeron ocho modelos predictivos empleando algoritmos representativos del aprendizaje supervisado: AdaBoost, Árboles de Decisión, Bosques Aleatorios, SVM, Perceptrón Multicapa, KNN, Naive Bayes y Regresión Logística. Su desempeño se evaluó mediante métricas como F1-score, MCC, ROC-AUC, índice de Gini, exactitud y desviaciones estándar, con el propósito de medir rendimiento y estabilidad. Los resultados muestran que los modelos basados en árboles, especialmente el Bosque Aleatorio, alcanzan el mejor desempeño, con una exactitud del 80 %. El estudio destaca contar con datos sistematizados y de alta calidad para construir modelos predictivos confiables. Como trabajo futuro se propone explorar configuraciones de ensamble, incorporar nuevos algoritmos y usar versiones actualizadas del ISBSG<hr/>RESUMO Este artigo apresenta os resultados de um projeto de pesquisa com o objetivo de estimar o esforço em projetos de desenvolvimento de software utilizando técnicas de aprendizado de máquina supervisionado. A análise foi desenvolvida seguindo a metodologia CRISP-DM, reconhecida por sua abordagem estruturada e ampla aceitação em mineração de dados. O estudo utilizou o conjunto de dados do International Software Benchmarking Standards Group (ISBSG), ao qual foram aplicados processos rigorosos de limpeza, transformação e seleção de variáveis. Quatro categorias de esforço foram definidas e variáveis-chave para sua classificação foram identificadas, como o tamanho funcional do software, a produtividade da equipe, a linguagem de programação e a plataforma de implementação. Oito modelos preditivos foram construídos utilizando algoritmos representativos de aprendizado supervisionado: AdaBoost, Árvores de Decisão, Florestas Aleatórias, SVM, Perceptron Multicamadas, KNN, Naive Bayes e Regressão Logística. Seu desempenho foi avaliado utilizando métricas como F1-score, MCC, ROC-AUC, índice de Gini, acurácia e desvios padrão, com o objetivo de mensurar o desempenho e a estabilidade. Os resultados mostram que os modelos baseados em árvores, especialmente a Floresta Aleatória, alcançam o melhor desempenho, com uma precisão de 80%. O estudo destaca a importância de se ter dados sistematizados e de alta qualidade para a construção de modelos preditivos confiáveis. Trabalhos futuros propõem explorar configurações de ensemble, incorporar novos algoritmos e utilizar versões atualizadas do ISBSG.