SciELO - Scientific Electronic Library Online

 
 issue67Analysis of the dynamic behavior of a vehicle with fully independent double-wishbone suspension and anti-roll barsSynthesis of two new Nickel and Copper- Nickel vanadates used for propane oxidative dehydrogenation author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • On index processCited by Google
  • Have no similar articlesSimilars in SciELO
  • On index processSimilars in Google

Share


Revista Facultad de Ingeniería Universidad de Antioquia

Print version ISSN 0120-6230

Rev.fac.ing.univ. Antioquia  no.67 Medellín Apr./June 2013

 

ARTÍCULO ORIGINAL

 

Clasificador neuronal de fallos en rodamientos utilizando entradas basadas en transformadas wavelet packet y de Fourier

 

Neural bearing faults classifier using inputs based on Fourier and wavelet packet transforms

 

 

Víctor Gómez1*, Ricardo Moreno2

1Facultad de Ingeniería y Arquitectura. Universidad de Pamplona. Km 1 vía Bucaramanga. Pamplona, Colombia.

2Grupo de Diseño Mecánico. Facultad de Ingeniería. Universidad de Antioquia. Calle 67 No. 53 - 108. Medellín, Colombia.

*Autor de Correspondencia: teléfono: + 57 + 4 + 2840109, correo electrónico: victor.gomez.ramirez@hotmail.com (V. Gómez)

 

(Recibido el 30 de mayo de 2012. Aceptado el 24 de mayo de 2013)

 

 


Resumen

En este artículo se propone y se evalúa experimentalmente un método de diagnóstico de fallas en rodamientos utilizando la clasificación de patrones provenientes de las señales de las vibraciones mecánicas. El método utiliza pre-procesamientos con las transformadas de Fourier y wavelet packet para luego alimentar una red neuronal clasificadora que determina el tipo de fallo. Para evaluar las variables de entrada se realiza un análisis de varianza ANOVA comparando el efecto que tienen los factores: velocidad, carga, falla en pista externa y falla en elemento rodante sobre cada uno de los parámetros propuestos como entradas para las redes neuronales artificiales (RNA). Una vez seleccionadas las variables de entrada más adecuadas, se realiza la búsqueda del clasificador más apropiado explorando diversas configuraciones de red neuronal. Se han entrenado alrededor de 2000 RNA con el propósito de encontrar el clasificador más adecuado. Los resultados de validación muestran que para el algoritmo de entrenamiento tipo gradiente conjugado escalado (trainscg) se alcanza un porcentaje de éxito en la clasificación del 88,5 %, mientras que para el algoritmo de entrenamiento de Levenberg-Marquardt (trainlm) se logra un 91,8 %. Adicionalmente, se resalta que en 7 ocasiones se logró el 100 % de aciertos en la clasificación.

Palabras clave: Vibraciones mecánicas, diagnóstico de fallas, rodamientos, redes neuronales artificiales, transformada wavelet packet


Abstract

In this paper one method for bearings diagnosis is proposed and evaluated. This method use signal pattern recognition from mechanical vibrations. Wavelet and Fourier transforms are used for pre-processing the signal and an Artificial Neural Network (ANN) is used as a classifier. Analysis of variance (ANOVA) is used for evaluating the ANN inputs. ANOVA is performed to compare the effect of the factors: speed, load, outer race fault and rolling element fault on each of the parameters proposed as inputs of the ANN, looking for the best parameters for classifying the faults. About 2000 ANN structures were trained in order to find the most appropriate classifier. The results show that the average of success in classifying was 88,5 % for the scaled conjugate gradient algorithm (trainscg), while the Levenberg Marquardt algorithm (trainlm) presented 91,8 %. Besides, it was possible to achieve 100 % of success in classifying in 7 cases.

Keywords: Mechanical vibrations, fault diagnosis, bearings, artificial neural networks, wavelet packet transform


 

 

Introducción

Los rodamientos y los engranajes son elementos mecánicos bastante comunes en maquinaria rotativa que merecen una atención especial en los programas de mantenimiento. Los fallos en estos elementos pueden causar paros no programados en la producción con grandes pérdidas económicas para las empresas [1], siendo los fallos en los rodamientos la causa más común de paradas en la maquinaria rotativa [2].

El monitoreo de condición de elementos mecánicos utilizando la identificación de patrones provenientes de las señales vibratorias, ha cobrado gran importancia en las últimas décadas. Para la extracción de patrones de las señales, se debe analizar información no lineal y no estacionaria que puede ser procesada con transformaciones del tipo tiempo-frecuencia [3]. La descomposición empírica, modelos autorregresivos, procesamiento de señal con correlación iterativa, la transformada de Fourier (TF) y la transformada wavelet han sido muy útiles para extraer patrones de las señales vibratorias, mientras que las redes neuronales artificiales (RNA) han ayudado a realizar las clasificaciones de dichos patrones para determinar los fallos.

Fallos incipientes en rodamientos producen pequeños impulsos transitorios que excitan las frecuencias naturales del sistema y producen patrones que están relacionados con el tipo de fallo, sin embargo, estos impulsos son débiles y difíciles de encontrar por el ruido presente en la señal. Liu et. al. [4] han propuesto un algoritmo para el diagnóstico automático de fallos en rodamientos utilizando la búsqueda de correlaciones entre la señal y un diccionario de patrones base. Este algoritmo ha mostrado ser efectivo para extraer los impulsos de las fallas en rodamientos, pero requiere el cálculo del espectro de kurtosis y encontrar las frecuencias de resonancia.

Los modelos paramétricos autorregresivos también han sido probados para extraer patrones de las señales vibratorias y diagnosticar fallos en rodamientos. Modelos autorregresivos integrados con heterocedasticidad condicional han mostrado un buen desempeño frente a la interrelación entre la información estacionaria y la no estacionaria de las señales vibratorias para facilitar la clasificación de los fallos [5].

La descomposición empírica es una importante herramienta en el dominio tiempo-frecuencia que también puede ser utilizada para el análisis de procesos no lineales y no estacionarios. Esta descomposición es auto-adaptativa y está basada en escalas temporales locales, sin embargo las funciones base no son estrictamente ortogonales entre ellas lo que puede crear modos combinados. Un buen recuento de la descomposición empírica ha sido publicado por Lei et. al. [6].

La transformada wavelet packet (WP) puede trabajar bien con señales no estacionarias debido a sus propiedades de localidad y ortogonalidad. Esta transformada permite obtener un árbol de componentes en el dominio tiempo-frecuencia sin perder la energía de cada componente. Recientemente se han combinado la transformada WP con la técnica de aprendizaje variado (manifold learning technique, MLT) para poder sumar las ventajas del análisis de señales no estacionarias (WP) con las no lineales (MLT). Esta combinación ha mostrado grandes ventajas, no solo para clasificar el tipo de fallos, sino su grado de severidad [7].

Otra combinación usada es el uso de la transformada wavelet con redes neuronales artificiales y reglas fuzzy. La transformada wavelet sirve para extraer características de la señal (pre-procesamiento apto para señales no estacionarias) y la red neuronal y reglas fuzzy ayudan a la clasificación, soportando casos no lineales. Jayaswal et. al. [8] han propuesto esta combinación para detectar defectos en la pista exterior, elementos rodantes y pista interior en rodamientos obteniendo resultados prometedores.

Debido a que todos los investigadores reportan excelentes resultados al probar todas las técnicas, es curioso que todavía no haya un método de amplio uso a nivel industrial para la detección de fallos incipientes en rodamientos. Por tal motivo, en este trabajo se evalúan ampliamente ambas etapas: identificación de patrones y clasificación de fallos. Para la identificación de patrones se utilizarán las transformadas TF y WP, éstas se evaluarán con análisis de varianzas provenientes de un diseño experimental multifactorial cuyos factores son: velocidad de giro, carga, fallos en pista externa y fallos en elemento rodante. El análisis de varianza permitirá identificar cuáles factores tienen un mayor efecto estadísticamente significativo sobre los parámetros candidatos para ser entradas para la red neuronal. Para la clasificación se evaluarán diversas estructuras de redes neuronales y diversos tipos de entrenamientos para verificar la eficiencia en la caracterización de la falla.

 

Identificación de patrones: pre-procesamiento de la señal

Para la etapa de pre-procesamiento de la señal se utilizan las transformadas TF y WP. La TF ayuda a obtener las magnitudes de las componentes a las frecuencias de interés, aunque tiene la limitación de evaluarse solo bajo procesos periódicos-estacionarios. La transformada WP puede ser utilizada para caracterizar señales no estacionarias, esta descomposición se implementa a través de filtros digitales pasa bajas y pasa altas, que ayudan a obtener las aproximaciones y los detalles respectivamente, en cada uno de los niveles formando un árbol diádico. A medida que se aumenta un nivel de descomposición se duplican los nodos (aproximaciones y detalles) presentes en cada nivel.

Los fallos en los rodamientos generalmente inducen pequeños cambios en la señal que se reflejan en el espectro de frecuencias. Algunos de dichos cambios en el espectro se manifiestan en frecuencias cercanas a la frecuencia de giro, la frecuencia de fallo de pista exterior, la frecuencia de fallo en el elemento rodante y en los armónicos de cada una de las frecuencias mencionadas. En este caso, se ha decidido considerar los dos primeros armónicos. Es decir que existen 9 posibles intervalos alrededor de dichas frecuencias donde se deben aplicar las transformadas para obtener valores numéricos que ayuden a evaluar los posibles cambios debidos a los fallos. La tabla 1 muestra las 9 frecuencias de interés (estas frecuencias varían según la velocidad de operación del sistema).

 

Con la transformada de Fourier se calcula la densidad espectral de potencia (DEP) alrededor de cada frecuencia de interés. Luego, se procede a realizar una integración para obtener la potencia de la señal en un intervalo de ±3Hz en cada frecuencia de interés. En cercanías a las frecuencias de giro y sus armónicos se utilizaron intervalos de integración de ±2,5Hz para evitar traslapes entre los intervalos (ver ecuaciones en la tabla 2).

 

La transformada WP se aplica alrededor de las mismas frecuencias de interés y con intervalos similares. Para realizar esto se requiere llegar hasta el nivel 13 que permite obtener componentes con un ancho de banda de 0,909Hz. En cada intervalo de escalas equivalentes, próximas al rango de frecuencias de interés, se calcula el valor RMS. Por ejemplo, en el intervalo alrededor de la frecuencia de fallo de los elementos rodantes, el cálculo se realiza según la fórmula planteada en la ecuación (1).

Donde V1Xrmsrp es el valor cuadrático medio de la señal S generada a partir de la reconstrucción de la transformada WP dentro del rango especificado por el intervalo (Frp-3, Frp+3).

Para obtener la escala equivalente a la frecuencia de interés se utiliza la fórmula matemática presentada por Chiementin et. al. [9] en la ecuación (2):

Donde

s es la escala.

Δ es el periodo de muestreo.

Fc es la frecuencia central de la wavelet en Hz.

Fs es la seudo frecuencia correspondiente a la escala s, en Hz.

Según Misiti [10], las wavelets madre Daubechies son muy eficientes para la detección de transitorios rápidos. Estas wavelets han sido utilizadas exitosamente en trabajos anteriores [2, 11]. En este trabajo se emplea específicamente la wavelet madre Daubechies 6.

 

Clasificación de fallos: redes neuronales artificiales

En el presente trabajo, para la clasificación de fallos, se consideran las RNA feed-forward multicapa con aprendizaje supervisado. La capa de salida tiene 5 neuronas, una para cada condición de falla o categoría.

Con el propósito de encontrar un buen clasificador, se exploran distintas configuraciones en la arquitectura de red seleccionada. Por lo tanto, difieren en la cantidad de neuronas de la capa oculta o en los parámetros de entrada, las funciones de activación (tangente hiperbólica y exponencial para la capa oculta y tangente hiperbólica y lineal para la capa de salida) y los algoritmos de entrenamiento (tipo gradiente conjugado escalado o tipo Levenberg-Marquardt). La figura 1 muestra el esquema del procesamiento de la señal para realizar las clasificaciones de los fallos.

 

Diseño experimental

En la figura 2 se muestra el banco de ensayos en el que se ha instalado un acelerómetro piezoeléctrico adherido a la carcasa del rodamiento de prueba en la dirección horizontal.

 

El rodamiento de prueba es a rótula de dos hileras de rodillos marca SNR referencia 22207 EAKW33C3. Las frecuencias de falla suministradas por el fabricante a 60 rpm para el anillo interior girando se describen en la tabla 3.

 

Se ha establecido una frecuencia de muestreo de 10,24 KHz (frecuencia de corte de 5 KHz) y el tiempo de captura de la señal de 5 segundos.

Se realizó un experimento multifactorial con un modelo de efectos fijos con los factores y niveles mostrados en la tabla 4.

 

Los defectos son generados con una herramienta rotativa de alta velocidad y una broca de punta de carburo de tungsteno 9911. Se producen ranuras paralelas al eje de rotación. Las figuras 3 y 4 se muestran las fallas inducidas.

 

En la tabla 5 se resume el análisis ANOVA que permite identificar los efectos de los factores: sobre cada uno de los 18 parámetros propuestos provenientes de las WP y TF (9 parámetros relacionados con WP y 9 parámetros relacionados con TF). Este análisis es determinante para seleccionar las entradas más representativas que alimentan el clasificador basado en la RNA.

 

Para seleccionar los parámetros más representativos, se establecen los siguientes criterios:

- Por una frecuencia de falla y sus armónicos se selecciona máximo 1 parámetro.

- El parámetro elegido debe tener el valor p menor que 0.01 para alguno de los dos factores de falla.

- El parámetro debe tener el mayor valor F en cualquiera de los dos factores de falla.

Los parámetros seleccionados como los más representativos del estado del rodamiento son: P1X, P3XFep, P2XFrp, V3Xrms, V3Xrmsep, V3Xrmsrp.

El entrenamiento de la red neuronal es estático, es decir, en cada ciclo de entrenamiento se recalculan los pesos de la red tras presentar todos los patrones de entrenamiento. Para el entrenamiento de la red se tienen 135 patrones y 135 vectores de salida de 5 elementos. Estos serán divididos aleatoriamente en 2 grupos de acuerdo a la función ''dividerand'' incorporada en MATLAB® en 80% (108 patrones) para entrenamiento y 20 % (27 patrones) para validar el desempeño de la red. La validación se realiza por medio de la función de desempeño y el porcentaje de aciertos obtenido en la matriz de confusión. Ya que sólo se utilizan 27 datos para la validación, el desacierto en la clasificación en una de las clases implica una disminución de 3.703% del caso ideal de 100%. Los pesos y los umbrales de la red se inicializan aleatoriamente de acuerdo a la función de inicialización ''rands'' de MATLAB®.

Se prueban 2 algoritmos rápidos de entrenamiento Backpropagation: el tipo de escala con gradiente conjugado (trainscg) y Levenberg-Marquardt (trainlm). En la tabla 6 se presentan los ajustes realizados a las redes para el entrenamiento.

 

Con el propósito de comparar el desempeño de los parámetros seleccionados, se entrena el clasificador con los siguientes 4 grupos de parámetros:

• Todos los parámetros basados en la Transformada de Fourier (total 9). Colección 1.

• Todos los parámetros RMS basados en la reconstrucción WP (total 9). Colección 2.

• Selección realizada en el análisis ANOVA (total 6). Colección 3.

Con las colecciones de parámetros 0, 1 y 2 y con cada uno de los dos algoritmos de aprendizaje se ha procedido como sigue: se comienza con 5 neuronas en la capa oculta, se reinicializan los pesos 5 veces para buscar diferentes mínimos en la superficie de error, luego se cambia las funciones de activación (4 posibilidades) y se reinicializan los pesos 5 veces. De acuerdo a esto se tienen 20 RNA por algoritmo. Este proceso se repite 10 veces incrementando en 5 neuronas la capa oculta hasta llegar a las 50, por lo que se generan 200 redes por algoritmo de entrenamiento, es decir 400 RNA por cada colección de parámetros y 1200 RNA en total para las colecciones 0,1 y 2. En la colección 3 se reinicializan los pesos 10 veces, produciéndose 800 redes más. Es decir que se han probado 2000 RNA.

Las tablas 7 y 8 muestran ejemplos de los resultados para el caso de la colección 0 (todos los parámetros) y la colección 3 (los parámetros seleccionados por el análisis de varianza ANOVA).

 

Resultados de la clasificación

El mejor comportamiento promedio del algoritmo trainscg es de 88,5%, que se presenta con las entradas de la colección 3, con 50 neuronas y función de activación Logsigen en la capa oculta, y función de activación lineal en la capa de salida. El mejor comportamiento promedio del algoritmo trainlm es de 91,85%, que se presenta con las entradas del colección 0, con 45 neuronas y función de activación Tangsig en la capa oculta, y función lineal en la capa de salida.

En la validación se ha logrado el 100% de efectividad en 7 ocasiones (ver tabla 9).

 

Es importante resaltar que de los 7 casos que obtuvieron el 100% de aciertos en validación, 6 de ellos utilizaron la colección 3. Esto es un indicador de la acertada elección de los parámetros de la colección 3 y del aporte conjunto de parámetros de la WP y de la DEP seleccionados utilizando la ANOVA, para extraer información que permita a la RNA realizar el diagnóstico de la condición.

 

Conclusiones

La detección de fallos utilizando los parámetros pre-seleccionados con los análisis de varianza provenientes de la FT y la WP, tuvo un excelente comportamiento promedio en la validación, ya que ésta produjo la más alta relación entre el mejor porcentaje promedio de aciertos y el número de entradas (88,51% en promedio, 6 parámetros). Las demás colecciones obtuvieron relaciones inferiores: sólo los parámetros de TF (85,18% en promedio, 9 parámetros), sólo los parámetros provenientes de WP (64,4% en promedio, 9 parámetros), todos los parámetros (91,85% en promedio, 18 parámetros). Esto confirma el aporte de la WP en el aumento de la eficiencia del clasificador.

La exigencia de la validación de los clasificadores propuestos, ha mostrado que la RNA junto a los 6 parámetros seleccionados tiene grandes prestaciones y una gran confiabilidad. Se obtuvieron porcentajes promedio de aciertos alrededor del 88%, utilizando el 20% de los datos para validación. Este es un resultado muy prometedor debido a que un sólo error en la clasificación era castigado con una disminución del 3,703% en el porcentaje de aciertos. Es decir que de 27 datos utilizados para la validación se tuvieron en promedio 24 aciertos y sólo 3 errores en la clasificación.

Obtener resultados cercanos al 90% de aciertos después de haber intentado con tantos tipos de redes neuronales y con potentes transformadas en el pre-procesamiento muestra que todavía hay significativas posibilidades de falsas alarmas para la detección de fallos incipientes en rodamientos, lo que explica el motivo de que estas técnicas no sean todavía ampliamente usadas a nivel industrial.

 

Referencias

1. P. Girdhar, C. Scheffer. ''Machinery fault diagnosis using vibration analysis''. Practical Machinery Vibration Analysis and Predictive Maintenance. Ed. Elsevier. Oxford. England. 2004. pp. 89-133.         [ Links ]

2. C. Castejón, O. Lara, J. García. ''Automated diagnosis of rolling bearings using MRA and neural networks''. Mechanical Systems and Signal Processing. Vol 24. 2010. pp. 289-299.         [ Links ]

3. Q. He. ''Time-frequency manifold for nonlinear feature extraction in machinery fault diagnosis''. Mechanical Systems and Signal Processing. Vol 35. 2013. pp. 200-218.         [ Links ]

4. X. Liu, L. Bo, X. He, M. Veidt. ''Application of correlation matching for automatic bearing fault diagnosis''. Journal of Sound and Vibration. Vol. 331. 2012. pp. 5838-5852.         [ Links ]

5. G. Wang, C. Liu, Y. Cui. ''Clustering diagnosis of rolling element bearing fault based on integrated Autoregressive /Autoregressive Conditional Heteroscedasticity model''. Journal of Sound and Vibration. Vol. 331. 2012. pp. 4379-4387.         [ Links ]

6. Y. Lei, J. Lin , Z. He, M. Zuo. ''A review on empirical mode decomposition in fault diagnosis of rotating machinery''. Mechanical Systems and Signal Processing. Vol. 35. 2013. pp. 108-126.         [ Links ]

7. Q. He. ''Vibration signal classification by wavelet packet energy flow manifold learning''. Journal of Sound and Vibration. Vol. 332. 2013. pp. 1881-1894.         [ Links ]

8. P. Jayaswal, S. Verma, A. Wadhwani. ''Development of EBP-Artificial neural network expert system for rolling element bearing fault diagnosis''. Journal of Vibration and Control. Vol. 17. 2011. pp. 1131-1148.         [ Links ]

9. X. Chiementin, F. Bolaers, O. Cousinard, L. Rasolofondraibe. ''Early Detection of Rolling Bearing Defect by Demodulation of Vibration Signal Using Adapted Wavelet''. Journal of Vibration and Control. Vol. 14. 2008. pp. 1675-1690.         [ Links ]

10. M. Misiti, Y. Misiti, G. Oppenheim, J. Poggi. Wavelet and their applications. Ed. ISTE. London, England. 2010.         [ Links ]

11. N. Saravanan, K. Ramachandran. ''Incipient gear box fault diagnosis using discrete wavelet transform (DWT) for feature extraction and classification using artificial neural network (ANN)''. Expert Systems with Applications. Vol. 37. 2010. pp. 4168-4181.         [ Links ]