Scielo RSS <![CDATA[Revista ION]]> http://www.scielo.org.co/rss.php?pid=0120-100X20250002&lang=pt vol. 38 num. 2 lang. pt <![CDATA[SciELO Logo]]> http://www.scielo.org.co/img/en/fbpelogp.gif http://www.scielo.org.co <![CDATA[Avaliação de redes neurais artificiais recorrentes no diagnóstico de falhas no processo Tennessee-Eastman]]> http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-100X2025000200007&lng=pt&nrm=iso&tlng=pt Abstract Long Short-Term Memory (LSTM) recurrent neural networks were implemented in Python (TensorFlow/Keras, Google Colab) to detect and diagnose failures in the Tennessee Eastman Process (TEP). The 52 process variables were analyzed with Principal Component Analysis (PCA) and Hotelling’s T² as a baseline monitor. Single-layer LSTMs were then trained while varying hidden units (16 - 256), output activation functions (softmax, tanh, sigmoid), and epochs (10 - 30) to classify fault-free operation IDV(0) and the critical faults IDV(6) and IDV(18). Across training, validation, and testing, detection accuracy averaged ≈80 %. The best accuracy-generalization trade-off was achieved with a 16-unit LSTM trained for 10 epochs; longer training yielded only marginal gains (~4 % on average) and increased overfitting. Diagnostic metrics showed more reliable performance for IDV(0) and IDV(18) than for IDV(6). Extending the 16-unit model to all-fault TEP classes (5 - 25 epochs) produced the highest accuracies for IDV(2), IDV(6), IDV(12), and IDV(18), while several other faults achieved only modestly or null accuracy. Accordingly, LSTMs enable effective targeted diagnosis for the three considered TEP faults, whereas in the all-fault setting the LSTM yielded poor performance, requiring additional training epochs and possibly benefiting from alternative architectures.<hr/>Resumen Las redes neuronales recurrentes LSTM (Long Short-Term Memory) fueron implementadas en Python (TensorFlow/Keras, Google Colab) para la detección y el diagnóstico de fallas del Proceso Tennessee Eastman (TEP). Las 52 variables de proceso fueron tratadas con el Análisis de Componentes Principales (PCA) y el estadístico T² de Hotelling como referencia de detección. Las LSTM con una sola capa oculta y con diferente número de neuronas ocultas (16 - 256), funciones de activación de salida (softmax, tanh, sigmoid) y épocas (10 - 30) fueron entrenadas para clasificar la operación sin falla (IDV(0)) y las fallas críticas IDV(6) e IDV(18). En entrenamiento, validación y prueba, la exactitud de detección alcanzó un promedio de ≈80 %. La red LSTM con 16 neuronas ocultas, entrenada por 10 épocas reportó el mejor compromiso entre exactitud y capacidad de generalización en la detección; el uso de más épocas no aportó una ganancia significativa (~4 % en promedio), pero sí aumentaron el sobreajuste. Las métricas de diagnóstico mostraron un desempeño más confiable para IDV(0) e IDV(18) que para IDV(6). La red LSTM con 16 neuronas fue entrenada con todas las clases de falla del TEP (5 - 25 épocas), reportando las mayores exactitudes para IDV(2), IDV(6), IDV(12) e IDV(18); para las otras fallas, las exactitudes fueron bajas o nulas. Según lo anterior, las LSTM permiten un diagnóstico efectivo de las fallas clave del TEP consideradas en este trabajo. Para todas las fallas, las LSTM presentan un desempeño bajo, con lo cual probablemente requieran más épocas de entrenamiento. También, arquitecturas alternativas podrían reportar mejores desempeños para todas las fallas.<hr/>Resumo Redes neurais recorrentes do tipo Long Short-Term Memory (LSTM) foram implementadas em Python (TensorFlow/Keras, Google Colab) para detectar e diagnosticar falhas no Tennessee Eastman Process (TEP). As 52 variáveis de processo foram analisadas com Análise de Componentes Principais (PCA) e o T² de Hotelling como monitor de referência. Em seguida, LSTMs de uma única camada foram treinadas variando o número de unidades ocultas (16 - 256), as funções de ativação de saída (softmax, tanh, sigmoid) e o número de épocas (10 - 30) para classificar a operação sem falhas IDV(0) e as falhas críticas IDV(6) e IDV(18). Ao longo do treinamento, validação e teste, a acurácia média de detecção foi de ≈80 %. O melhor compromisso entre acurácia e generalização foi obtido com uma LSTM de 16 unidades treinada por 10 épocas; treinamentos mais longos resultaram apenas em ganhos marginais (~4 % em média) e aumentaram o sobreajuste. As métricas de diagnóstico mostraram desempenho mais confiável para IDV(0) e IDV(18) do que para IDV(6). Ao estender o modelo de 16 unidades para todas as classes de falhas do TEP (5 - 25 épocas), obtiveram-se as maiores acurácias para IDV(2), IDV(6), IDV(12) e IDV(18), enquanto várias outras falhas apresentaram acurácia apenas modesta ou nula. Assim, as LSTMs possibilitam um diagnóstico direcionado eficaz para as três falhas do TEP consideradas, ao passo que, no cenário com todas as falhas, a LSTM apresentou baixo desempenho, exigindo épocas adicionais de treinamento e possivelmente se beneficiando de arquiteturas alternativas.