32 1 
Home Page  

  • SciELO

  • Google
  • SciELO
  • Google


Ciencia e Ingeniería Neogranadina

 ISSN 0124-8170 ISSN 1909-7735

COTE-BALLESTEROS, Jorge E.; GRISALES PALACIOS, Victor Hugo    RODRIGUEZ-CASTELLANOS, Jhon Edisson. A Hybrid Approach Variable Selection Algorithm Based on Mutual Information for Data-Driven Industrial Soft-Sensor Applications. []. , 32, 1, pp.59-70.   03--2022. ISSN 0124-8170.  https://doi.org/10.18359/rcin.5644.

^a

The development of virtual sensors predicting the desired output requires a careful selection of input variables for model construction. In an industrial environment, datasets contain many instrumentation system measures; however, these variables are often non-relevant or excessive information. This paper proposes a variable selection algorithm based on mutual information examination, redundancy analysis, and variable reduction for soft-sensor modeling. A relevance calculation is performed in the first stage to select important variables using the mutual information criterion. Then, the detection and exclusion of redundant variables are carried out, penalizing undesired variables. Finally, the most relevant variables subset is determined through a wrapper method using Mallowssans' Cp metric to assess the fitting prediction performance. The approach was successfully applied to estimate the ethanol concentration for a distillation column process using an adaptive network-based fuzzy inference system architecture as a non-linear dynamic regression model. A comparative study was performed considering the application of correlation analysis and the method proposed in this study. Simulation results show the effectiveness of the proposed approach in the variable selection providing a reduction in search of suitable models that achieve faster results for developing soft sensors oriented to industrial applications.

^len^a

El desarrollo de sensores virtuales que predicen el resultado o producto deseado requiere una cuidadosa selección de variables de entrada para la construcción del modelo. En un entorno industrial, los conjuntos de datos contienen muchas medidas del sistema de instrumentación; sin embargo, estas variables suelen ser información no relevante o excesiva. Este artículo propone un algoritmo de selección de variables basado en el examen de información mutua, el análisis de redundancia y la reducción de variables para el modelado de sensores blandos. En la primera etapa se realiza un cálculo de relevancia para seleccionar variables importantes utilizando el criterio de información mutua. Luego, se realiza la detección y exclusión de variables redundantes, penalizando las variables no deseadas. Finalmente, el subconjunto de variables más relevante se determina a través de un método de envoltura utilizando la métrica Cp de Mallows para evaluar el rendimiento de la predicción de ajuste. El enfoque se aplicó con éxito para estimar la concentración de etanol para un proceso de columna de destilación utilizando una arquitectura de sistema de inferencia difusa basada en red adaptativa como un modelo de regresión dinámica no lineal. Se realizó un estudio comparativo considerando la aplicación del análisis de correlación y el método propuesto en este estudio. Los resultados de la simulación muestran la efectividad del enfoque propuesto en la selección de variables proporcionando una reducción en la búsqueda de modelos adecuados que logren resultados más rápidos para el desarrollo de sensores blandos orientados a aplicaciones industriales.

^les

: .

        · | |     · |     · ( pdf )