Learning the therapeutic use of drugs from the three-dimensional spatial information of their molecular structure with convolutional neural networks

Martínez-Conde, Jorge Mario; Patiño-Vanegas, Alberto; Martínez-Conde, Jorge Mario; Patiño-Vanegas, Alberto

doi:10.15446/dyna.v88n218.92778

Services on Demand

Journal

Article

Indicators

Cited by SciELO
Access statistics

DYNA

Print version ISSN 0012-7353On-line version ISSN 2346-2183

Dyna rev.fac.nac.minas vol.88 no.219 Medellín Oct./Dec. 2021 Epub Mar 15, 2022

https://doi.org/10.15446/dyna.v88n218.92778

Articles

Learning the therapeutic use of drugs from the three-dimensional spatial information of their molecular structure with convolutional neural networks

Aprendizaje del uso terapéutico de fármacos a partir de la información espacial tridimensional de su estructura molecular con redes neuronales convolucionales

Jorge Mario Martínez-Conde^a
http://orcid.org/0000-0002-0257-875X

Alberto Patiño-Vanegas^b
http://orcid.org/0000-0001-5783-192X

^{^a} Facultad de Ciencias Básicas, Universidad de Córdoba, Montería, Colombia. jorgemariomtz12@correo.unicordoba.edu.co

^{^b} Facultad de Ciencias Básicas, Universidad Tecnológica de Bolívar, Cartagena, Colombia. apatino@utb.edu.co

Abstract

The development of new molecules is a multi-stage process and clinical trials to verify their efficacy cost billions of dollars each year. Machine learning is a tool that is rapidly advancing in image, voice, and text recognition, and working in silico would increase the ability to predict and prioritize a drug's function. In this research we asked whether the function of therapeutic drugs can be predicted from the stereochemical configuration of the molecule. We use convolutional neural networks to predict the therapeutic use of drugs, trained with both two-dimensional and three-dimensional information of their chemical structure. The model trained with only six views of the 3D information of the molecular structure improved the accuracy by 10 over the model trained with the 2D information.

Keywords: convolutional neural networks; drugs; therapeutic use; 3D views; molecules

Resumen

El desarrollo de nuevas moléculas es un proceso que requiere de múltiples etapas y los ensayos clínicos para verificar su eficacia cuesta miles de millones de dólares cada año. El aprendizaje automático es una herramienta que está avanzando rápidamente en el reconocimiento de imágenes, voz y texto, y trabajar In silico aumentaría la capacidad de predecir y priorizar la función de un medicamento. En esta investigación nos preguntamos si la función de los medicamentos de uso terapéutico se puede predecir a partir de la configuración estereoquímica de la molécula. Nosotros usamos redes neuronales convolucionales para predecir el uso terapéutico de fármacos, entrenadas tanto con información bidimensional como con información tridimensional de su estructura química. El modelo entrenado solamente con seis vistas de la información 3D de la estructura molecular mejoró la exactitud en un 10 respecto al modelo entrenado con la información 2D.

Palabras clave: redes neuronales convolucionales; fármacos; uso terapéutico; vistas 3D; moléculas

1. Introducción

La investigación en el desarrollo de nuevas moléculas que optimicen una propiedad deseada se ha vuelto una necesidad en casi todos los sectores productivos como el alimenticio, el agropecuario, la salud y la industria, debido a que estos buscan aumentar la efectividad de dichas moléculas.

Los esfuerzos de la química sintética a lo largo del ultimo siglo ha logrado producir más de 60 millones de compuestos [¹] y el número de moléculas pequeñas, candidatos a fármacos asciende a más de 100 millones de moléculas diferentes [²]. Este gran número de moléculas a explorar es llamado espacio químico. El número de posibilidades es inmenso, incluso cuando este espacio se limita solamente a moléculas basadas en el modelo de Lipinski [³]. Este modelo establece, que para que un compuesto pueda ser suministrado oralmente, debe cumplir con al menos tres de las siguientes condiciones: (a) poseer un peso molecular por debajo de 500; (b) no tener más de 5 átomos donores de enlace de hidrógeno; (c) poseer un coeficiente de partición octanol-agua debajo de 5; y (d) no tener más de 10 átomos aceptores de enlace de hidrógeno.

A pesar de esta gran cantidad de estructuras químicas, se ha vuelto cada vez más difícil desarrollar nuevos medicamentos, en gran parte debido a la falta de eficacia, losefectos secundarios y los problemas de toxicidad que se presentan en su desarrollo [⁴].

Independientemente de la gran cantidad de moléculas disponibles el ritmo de aprobación de nuevos fármacos ha disminuido notablemente, dejando espacios para que nuevos métodos o técnicas que pueden mejorar el proceso actual [⁵]. Por ejemplo, las tecnologías in silico permiten acelerar el descubrimiento de nuevos fármacos y reducir los gastos que conlleva el trabajo experimental. Esta reducción de gastos se logra mediante la química computacional y mediante la creación de programas de predicciones con la ayuda de la bioinformática y la bioestadística [⁶].

Un método moderno para descubrir nuevas moléculas es el aprendizaje automático ⁷ junto con él las redes neuronales artificiales ⁸. Un tipo particular de red neuronal artificial y muy utilizada para resolver múltiples problemas prácticos en los que se requiere procesar una gran cantidad de imágenes o señales de gran tamaño son las redes neuronales convolucionales (RNC) [⁹-¹¹].

En este trabajo, se analizó el aprendizaje del uso terapéutico de fármacos a partir de su configuración estereoquímica usando redes neuronales convolucionales. Se escogieron 12 usos terapéuticos: Antiinfeccioso, Antiinflamatorio, Antineoplásico, Cardiovascular, Sistema nerviosos central (snc), Dermatológico, Gastrointestinal, Hematológicos, Regulación de lípidos, Control reproductivo, Sistema respiratorio, Urológicos [¹²].

La capacidad de los modelos de aprendizaje automático (in silico) para predecir la acción de las moléculas, ayudaría a reducir considerablemente el número de moléculas a probar empíricamente, ya que priorizaría las que el modelo prediga. De esta manera, se aumentaría la velocidad en la búsqueda del medicamento más eficaz y disminuiría los costos atribuidos a las pruebas empíricas.

En este trabajo se aborda el problema del aprendizaje de funciones de fármacos a partir de estructuras químicas. Recientemente se han evaluado dos métodos de clasificación de fármacos derivados de la estructura química: imágenes químicas con redes neuronales convolucionales [¹³] y huellas dactilares [¹⁴] moleculares con bosques aleatorios [¹⁵]. Los resultados que usaron la imagen química superaron las predicciones que utilizaron cambios transcriptómicos inducidos por fármacos como representaciones químicas (huellas dactilares). Ellos sugieren que la imagen de la estructura de una sustancia química tal como se muestra en la Fig. 1 contiene al menos tanta información sobre su uso terapéutico como la respuesta celular transcripcional a esa sustancia química [¹⁶].

Fuente: National Library of Medicine (NLM).

Figura 1 Imagen 2D de la estructura química de la Aspirina.

Dentro de los enfoques usados en la comunidad del Docking [¹⁷] hay uno en particular que usa la técnica de parejas, el cual describe la proteína y el ligando [¹⁸] como superficies complementarias [¹⁹,²⁰].

Esta complementariedad geométrica es un método que describe la proteína y el ligando como un conjunto de rasgos que los hace acoplables [²¹]. Estos rasgos pueden incluir la superficie molecular, o descriptores de la complementariedad de la superficie. En este caso, la superficie del receptor molecular es descrita en términos de su área superficial de accesibilidad solvente y la del ligando es descrita en sus términos de descripción a su ajuste a la superficie.

Basados en este enfoque de complementariedad de forma, en este trabajo nosotros proponemos considerar la información de la forma tridimensional de la estructura molecular, para el predecir la función de los fármacos [²²]. Esta idea se sustenta en el hecho de que el ligando y proteína tienen forma tridimensional y el acople del ligando a una proteína en particular debería depender de su forma tridimensional.

Es así, que para predecir la función de un fármaco se propone en este trabajo entrenar una red neuronal convolucional con diferentes vistas de su estructura molecular tridimensional, tal como se puede observar en la Fig. 2.

Fuente: Elaborado por los autores.

Figura 2 Imágenes 3D de la estructura química de la Aspirina.

En este trabajo, utilizamos el aprendizaje automático y las representaciones de las moléculas químicas en 2D y 3D de 12 categorías de uso terapéutico derivadas de MeSH [²³] (en inglés, MeSH, Medical Subject Headings) para predecir y clasificar las clases de usos terapéuticos como se observa en la Fig. 3.

Fuente: Elaborado por los autores.

Figura 3 Clasificación de drogas basadas en imágenes de estructuras químicas 2D y 3D para predecir la clase de los fármacos.

2. Metodología

Para la construcción de un sistema de reconocimiento para predecir la función de los fármacos de uso terapéutico a partir de su estructura química se puede optar por el uso de técnicas de extracción de las características manuales para luego alimentar un modelo de aprendizaje automático. En este trabajo se propone el uso de redes neuronales convolucionales, dado que permiten la extracción de las características de las estructuras química de forma automática.

Investigaciones realizadas en la misma área por Aliper et al. [¹³], Gitter et al [²⁴] y Ragoza en al [²⁵] proponen una labor de ensayo y error para encontrar los hiperparámetros adecuados de la red que permiten su buen entrenamiento, partiendo de algunos valores que han dado buen resultado en trabajos similares. Es por ello, que este trabajo se enmarca en el tipo de investigación experimental.

En este trabajo se realizó el estudio con una red neuronal convolucional para lograr predecir la función de fármacos de uso terapéutico, utilizando para su entrenamiento la información tridimensional de su estructura molecular.

Este trabajo fue inspirado en el artículo de Antony Gitter et al, los cuales usaron imágenes 2D de la estructura molecular de fármacos para 12 usos terapéuticos. Nosotros hemos escogido también los mismos 12 usos terapéuticos.

Los fármacos para las 12 categorías de uso terapéutico fueron seleccionados de la Biblioteca Nacional de Medicina y Centro Nacional de Información Biotecnológica, ubicados en la pagina web PubChem [²⁶] siguiendo la siguiente ruta: categoría productos químicos y drogas - acciones farmacológicas - usos terapéuticos.

En esta sección describiremos como fue construida la base de datos con la información 2D de la estructura molecular y cómo fue construida la base de datos con la información 3D.

2.1. Construcción de la base de datos con imágenes 2D de la estructura molecular del fármaco

Para generar las imágenes 2D de la estructura molecular de los fármacos, se realizó el procedimiento sugerido por Antony Gitter et al:

Los identificadores CIDs de cada molécula se convirtieron a cadenas SMILES [²⁷] usando el paquete de Python pubchempy (https://github. com/mcs07/PubChemPy).
Se excluyeron sustancias químicas de múltiples clases, para permitir una comparación directa.
La lista final se filtró para eliminar múltiples versiones de moléculas que difieren sólo por las sales que las acompañan.

Cada una de las imágenes 2D obtenidas tienen tres canales (RGB) con un tamaño de 500 x 500. En la Fig. 4 se muestra un ejemplo de la imagen 2D obtenida para la molécula de la Aspirina. En la Fig. 5 se observa mejor la frecuencia de fármacos por cada clase

Fuente: National Library of Medicine (NLM).

Figura 4 Imagen 2D de la estructura química de la Aspirina.

Fuente: Elaborado por los autores.

Figura 5 Cantidad de imágenes 2D por clase.

Por otro lado, se observa en la gráfica 5 que la base de datos obtenida se encuentra muy desbalanceada. Esto se debe a que en los usos terapéuticos escogidos de la base datos de PubChem existen más fármacos en una clase que en otra.

2.2. Aumentación digital de la base de datos con imágenes 2D de la estructura molecular del fármaco

Para aumentar la base de datos de imágenes 2D se crearon más imágenes a partir de transformaciones digitales. Para realizar esta aumentación se utilizó el paquete Augmentor [²⁸] de Python [²⁹] con el cual se crearon nuevas imágenes a partir de las imágenes originales que contiene cada clase.

Para hacer el sistema de predicción invariante a la rotación y a la escala de la imagen 2D de la molécula, nosotros en este trabajo hemos escogido realizar solamente dos transformaciones: rotación y acercamiento.

Las imágenes a rotar se escogieron de forma aleatoria con las siguientes condiciones:

Rotación: Las imágenes fueron rotadas entre 10 y 15 grados con respecto al originen, con una probabilidad de realizar la rotación de 0.7.
Acercamiento: A las imágenes que se le aplicó esta transformación tuvieron un acercamiento del 0.01% y 0.03%, con una probabilidad de realizar el acercamiento de 0.5.
Para algunas imágenes el comando le aplico ambas transformaciones.
La Fig. 6 muestra un ejemplo de la rotación realizada a una de las moléculas.

Fuente: Elaborado por los autores.

Figura 6 Ejemplo de rotación realizada a una imagen a) original b) rotación de 15º

La Fig. 7 muestra la frecuencia de las imágenes 2D obtenidas por cada clase después de realizada la aumentación digital. En total se crearon 4235 imágenes nuevas para un total de 10717 imágenes 2D.

Fuente: Elaborado por los autores.

Figura 7 Cantidad de imágenes 2D aumentadas por cada clase.

1.1 Construcción de la base de datos con imágenes 3D de la estructura molecular de los fármacos

Para construir una base de datos que aporte información tridimensional de la estructura molecular, la representación 3D de la estructura molecular que hemos escogido es Ball and Stick [³⁰] porque las barras son más visibles para representar el tipo de enlace y las bolas y su respectivo color diferencian mejor el tipo de átomo.

Para construir tal base de datos nosotros hemos decidido generar imágenes 2D con diferentes vistas de la imagen 3D de la molécula. Para escoger el numero de vistas a realizar para cada una de las moléculas nos hemos planteado la siguiente pregunta: ¿cuántas vistas son necesarias para reconstruir la estructura molecular 3D de una molécula? La respuesta no es única porque depende de la complejidad de la estructura 3D de la molécula. Nosotros en este trabajo hemos escogido solamente las 6 vistas que se obtienen al realizar las proyecciones sobre cada una de las caras del paralelepípedo en donde se inscribe la molécula. La Fig. 8 muestra un ejemplo del paralelepípedo donde se inscribe una molécula. Hubiésemos deseado construir más vistas para obtener más información del fármaco y seguramente un mejor rendimiento de la RNC; pero nos vimos limitados por nuestra capacidad actual de computo. Sin embargo, con el número de vistas tomado se pudieron contestar las preguntas de investigación.

Fuente: Elaborado por los autores.

Figura 8 Ejemplo de imagen 3D de la estructura molecular del Ácido acetilsalicílico.

El proceso para la creación de la base de datos con las seis vistas en 3D de las moléculas siguió los siguientes pasos:

El primer paso fue organizar la base de datos de cada una de las clases en un archivo de Excel por fila con la estructura 2D de cada una de las moléculas descritas con su cadena de SMILES.
El segundo paso fue realizar la transformación de las estructuras 2D a 3D. Para este proceso se utilizó una conexión online del software CORINA del Intituto Nacional de Cancer (NIH: National Cancer Institute). Cada uno de los SMILES se transformó a un archivo de dato SDF (Spatial Data File).
El tercer paso consistió en la creación de las 6 vistas. Para ello se utilizó el software MATLAB versión R2018a (9.4.0.813654) para leer los archivos SDF y realizar una visualización 3D. Luego, se realizaron rotaciones sobre el eje x y y en cada rotación se guardo la imagen 2D correspondiente. Sobre el eje x se realizó una rotación cada 90º hasta completar 360º y sobre eje y primero se hizo una rotación de 90º y luego de 180º.

Un ejemplo de las vistas 2D obtenidas para la molécula de la Aspirina se muestra en la Fig. 2. Este proceso se realizó de forma individual para los 6956 archivos SDF generados con CORINA. Algunos archivos SDF no fueron admitidos por el software CORINA, por razones desconocidas, por lo tanto, el número total de imágenes generadas fue de 21397.

La Fig. 9 muestra la frecuencia de las imágenes 3D obtenidas por cada clase después de realizar las seis vistas. En total se crearon 21397 vistas 2D con la imagen tridimensional de cada molécula.

Fuente: Elaborado por los autores.

Figura 9 Cantidad de imágenes 3D por cada clase.

En la Tabla 1 se muestra la distribución de las imágenes 2D y 3D de las moléculas por cada una de las clases de fármacos.

Tabla 1 Resumen de la cantidad de imágenes por clases.

Fuente: Elaborado por los autores.

Primero presentaremos los resultados obtenidos con una RNC desde cero. Usando inicialmente la base de datos con imágenes 2D y luego usando la base de datos con imágenes 3D.

Luego, presentaremos los resultados usando transferencia de aprendizaje. inicialmente usamos la base de datos con imágenes 2D, luego usando la base de datos 2D aumentada digital y finalmente con la base de datos con imágenes 3D.

Finalmente, presentamos los resultados obtenidos en el pronóstico del uso terapéutico de un fármaco al cual se le ha comprobado que tiene dos principios activos.

La métrica utilizada para comparar cada uno de los modelos fue la exactitud ya que nos interesa saber que porcentaje de fármacos clasifica correctamente; y para validar el rendimiento del modelo para cada una de las clases de uso terapéutico se utilizó la precisión ya que nos indica que cuando los clasifica positivos que porcentaje clasifica correctamente.

3. Resultados

3.1. Redes neuronales desde cero

En el entrenamiento de esta red las imágenes fueron reescaladas a un tamaño de 250 x 250, las funciones de activación usadas fueron ReLu en las capas ocultas y Softmax como capa de salida, la función de pérdida utilizada fue la entropía cruzada, el optimizador utilizado fue el Adamax con una tasa de aprendizaje de 0.001.

3.2. Resultados con base de datos 2D

Con este modelo se logró una Exactitud del 52\%. Aunque el resultado no fue el mejor, el modelo logra predecir el uso terapéutico de algunos fármacos a partir de su representación 2D.

3.3. Resultados con base de datos 3D

Con este modelo se logró una Exactitud del 61\%. Aunque el resultado no fue el mejor, se muestra que hubo una mejoría en la predicción del uso terapéutico de algunos fármacos a partir de su representación 3D.

3.4. Resultados con transferencia de aprendizaje

Para la transferencia de aprendizaje se usaron los pesos de ResNet-50, una red neuronal convolucional con 50 capas, distribuidas en 32 capas de convolución normal, 16 capas de convolución separables en profundidad y dos capas de convolución densamente conectadas. Las imágenes fueron re-escaladas a un tamaño 224 x 224, usando ReLu como función de activación en las capas profundas y SoftMax en la capa de salida, el padding utilizado fue same para obtener la misma dimensión cuando se apliquen los filtros, para controlar el cambio de distribución se aplicó una capa de normalización, la cantidad de épocas programadas fue de 50 con un tamaño por lote de 16, en este entrenamiento no se aplicó aumentación de datos.

Esta arquitectura se usó tanto para la base de datos con imágenes 2D como para 3D.

3.5. Resultados con base de datos 2D sin aumentación de datos

Con la base de datos 2D el mejor resultado se logró con una tasa de aprendizaje de 0.001. La Fig. 10 muestra en la matriz de confusión obtenida.

Fuente: Elaborado por los autores.

Figura 10 Matriz de confusión con transferencia de aprendizaje (ResNet50) con imágenes 2D.

Se puede observar que este modelo no clasificó ningún fármaco ni para uso terapéutico del sistema respiratorio ni urológico. Este resultado puede deberse a que estas clases son las que tienen menos imágenes 2D de fármacos. Aunque la clase de los medicamentos gastrointestinales a pesar tener una menor cantidad de fármacos que los antiinflamatorios tuvo una mejor predicción. Por otro lado, la clase que mejor predijo fue los fármacos antiifecciosos con un 77%. Esta clase es la que más imágenes de fármacos tiene (ver gráfica 5). Finalmente, este modelo obtuvo una exactitud del 57.86% superando la obtenida con el modelo sin realizar transferencia de aprendizaje (ver 3.2)

3.6. Resultados con base de datos 2D con aumentación de datos

En este modelo se uso una tasa de aprendizaje de 0.001 Los resultados de la clasificación se muestran en la Fig. 11.

Fuente: Elaborado por los autores.

Figura 11 Matriz de confusión con transferencia de aprendizaje (ResNet50) con imágenes 2D más aumentación digital.

En este modelo la clase de los medicamentos para tratar problemas hematológicos fue la más difícil de predecir. El 25% de los medicamentos usados para tratar problemas hematológicos se predijeron incorrectamente como medicamentos para tratar problemas cardiovasculares. Finalmente, el modelo obtuvo una exactitud del 65.09%, superando a la obtenida con el mismo modelo, pero sin realizar aumentación de datos.

3.7. Resultados con base de datos 3D

En este tercer modelo se uso una tasa de aprendizaje de 0.001 los resultados de la clasificación se muestran en la Fig. 12.

Fuente: Elaborado por los autores.

Figura 12 Matriz de confusión con transferencia de aprendizaje (ResNet50) con imágenes 3D.

Con este modelo se obtuvo una exactitud del 67.47%, superando el obtenido cuando se usó imágenes 2D.

En los resultados obtenidos con la base de datos 2D sin aumentación de datos (grafico 10) los medicamentos que pertenecen a la clase del sistema respiratorio y urológicos no clasificaron ningún medicamento, estas clases son las que menos muestras tienen y esto puede ser un factor que esté causando la baja precisión en las clases con este tipo de muestras. La clase más fácil de predecir fue la de los medicamentos antineoplasticos con un 77% de precisión, por otro, lado, la clase más difícil de predecir (omitiendo al sistema respiratorio y urológicos) fue los medicamentos dermatológicos, el 33% de los medicamentos usados para tratar estos problemas se predijeron incorrectamente como medicamentos para tratar enfermedades del sistema nervioso central y un 22% se predijeron incorrectamente como medicamentos para tratar problemas cardiovasculares.

En los resultados obtenidos con base de datos 2D con aumentación de datos (grafico 11) el modelo obtuvo un aumento en la exactitud con respecto al modelo 3.5. La clase de los medicamentos para tratar problemas hematológicos fue la más difícil de predecir, el 25% de los medicamentos usados para tratar problemas hematológicos se predijeron incorrectamente como medicamentos para tratar problemas cardiovasculares. la clase de los medicamentos urológicos a pesar tener la menor cantidad de fármacos a entrenar dentro de las clases fue la que mejor predijo seguida de la clase de los medicamentos antiinfecciosos.

En los resultados obtenidos con base de datos 3D (grafico 12) la precisión por clase para predecir los medicamentos de uso terapéutico tuvo un aumento en comparación con el modelo con imágenes 2D (grafico 10) y el modelo con imágenes 2D más el aumento de imágenes digitales (grafico 11) en la mayoría de las clases, siendo este uno de los mejores modelos encontrados para predecir la función de los medicamentos cuando tenemos doce clases. Por otro lado, la clase más difícil de predecir fue los medicamentos urológicos, el 38% de los fármacos usados para tratar estos problemas se predijeron incorrectamente como medicamentos para tratar problemas antineoplasticos finalmente la clase que mejor predijo fue los medicamentos antiinfecciosos con un 86% de precisión.

3.8. Validación de los modelos con la desloratadina

Para verificar si efectivamente los modelos entrenados con vistas 2D de la estructura 3D de las moléculas, aportan una mejor información sobre el uso terapéutico de un fármaco; nosotros hemos validado el modelo con la Desloratadina. Este medicamento fue creado inicialmente para uso Antihistaminico (inhibe ampliamente la respuesta alérgica), pero el trabajo de Carretero [³¹] demostró que también posee un uso Antiinflamatorio.

El uso terapéutico Antihistamínico no se incluyó dentro de las clases escogidas para el entrenamiento. Es así como, los modelos a comparar deberían predecir que la Desloratadina tiene un uso terapéutico principalmente Antiinflamatorio. Se debe aclarar, que la Desloratadina no fue usada en el entrenamiento de ninguno de los modelos, por lo tanto, las redes a validar no han memorizado su estructura molecular.

3.9. Validación del modelo con imágenes 2D

En la Fig. 13 se muestra la imagen 2D usada para predecir el uso terapéutico de la Desloratadina con el modelo entrenado con imágenes 2D más aumentación de datos. El resultado obtenido se muestra en la Fig. 14.

Fuente: National Library of Medicine (NLM).

Figura 13 Imagen 2D de la estructura química de la Desloratadina, fuente Puchem.

Fuente: Elaborado por los autores.

Figura 14 Predicción del uso terapéutico de la Desloratadina usando el modelo entrenado con imágenes 2D (Valores de Precisión).

Los valores de la precisión para el top-3 del uso terapéutico obtenido de la Desloratadina se muestran en la Tabla 2.

Tabla 2 Top-3 de la predicción del uso terapéutico de la Desloratadina usando el modelo entrenado con imágenes 2D.

Fuente: Elaborado por los autores.

3.10. Validación del modelo con imágenes 3D

En la Fig. 15 se muestran las seis vistas 2D usada para predecir el uso terapéutico de la Desloratadina con el modelo entrenado con imágenes 3D. Con cada una de las seis vistas el modelo predijo el uso terapéutico de la Desloratadina como un medicamento que ayuda en los procesos antiinflamatorios. El resultado obtenido con la vista 1, se muestra en la Fig. 16, las gráficas son similares para las demás vistas ya que los valores de la probabilidad para el Antiinflamatorio fueron superiores al 99%. Los valores de la precisión para el top-3 del uso terapéutico obtenido de la Desloratadina con cada una de las 6 vistas, se muestran en la Tabla 3.

Fuente: Elaborado por los autores.

Figura 15 Vistas 2D de la estructura química 3D de la Desloratadina.

Fuente: Elaborado por los autores.

Figura 16 Predicción del uso terapéutico de la Desloratadina usando el modelo entrenado con vistas de la imagen 3D (Valores de Precisión).

Tabla 3 Top-3 de la predicción del uso terapéutico de la Desloratadina usando el modelo entrenado con imágenes 3D.

Fuente: Elaborado por los autores.

Observamos en la Tabla 2 que entrenando el modelo solamente con imágenes 2D de la estructura molecular, el modelo no predice que la Desloratadina tiene un principio activo asociado con un uso Antiinflamatorio. Por el contrario, los resultados mostrados en la Tabla 3, muestran que entrenando el modelo con vistas de la imagen 3D de la estructura molecular, el modelo predice correctamente que la Desloratadina tiene un principio activo asociado con un uso Antiinflamatorio.

4. Discusión

En este trabajo exploramos la posibilidad de utilizar técnicas de aprendizaje profundo para predecir el uso terapéutico de fármacos, basándose únicamente en la información tridimensional de su estructura molecular. Para la predicción se utilizó una red neuronal convolucional, entrenada con seis vistas de la imagen tridimensional de la estructura molecular de cada fármaco. A pesar de que únicamente se usaron 6 vistas, los resultados fueron superiores que con el entrenamiento realizado solamente con la información bidimensional de la estructura molecular del fármaco.

Cuando se usó transferencia de aprendizaje, el modelo entrenado con la información 2D solo mejoró la exactitud un 2.5% respecto al modelo entrenado con la información 2D aumentada digitalmente. Sin embargo, el modelo entrenado con la información 3D de la estructura molecular (6 vistas) mejoró la exactitud en un 10% respecto al modelo entrenado con la información 2D.

Finalmente, mostramos con la predicción del uso farmacéutico de la Desloratadina, que estos modelos pueden ser utilizados para la clasificación de medicamentos con múltiples usos terapéuticos. De esta manera, es posible reinterpretar los resultados de la clasificación. Por ejemplo, los fármacos clasificados de forma incorrecta para una determinada clase podrían ser una indicación de su potencial para un nuevo uso terapéutico. Por lo tanto, una clasificación errónea puede dar lugar a descubrimientos inesperados. Este enfoque abre una gran vía para la aplicación de los modelos de redes neuronales convolucionales en el campo de la reorientación de medicamentos.

Para trabajos futuros se puede tener en cuenta las siguientes recomendaciones:

Aumentar la base de datos con la información 3D de la estructura molecular. La tridimensionalidad de las estructuras moleculares permite que se puedan tomar una mayor cantidad de vistas que las utilizadas en este trabajo por razones de capacidad de computo. De esta manera, se podría balancear la base de datos nivelando las clases que tengan menos fármacos.
Optimizar la estructura molecular de los fármacos de tal forma que su representación 3D sea la más adecuada. Se pueden explorar técnicas de optimización geométrica, cuyo objetivo es obtener las conformaciones estructurales de más baja energía para predecir la disposición tridimensional óptima de los átomos en una molécula.

Bibliografía

[1] Lipkus, A.H., Yuan, Q., Lucas, K.A., et al., Structural diversity of organic chemistry. A scaffold analysis of the CAS registry. J. Org. Chem., 73(12) pp. 4443-4451, 2008. DOI: 10.1021/jo8001276 [ Links ]

[2] Ruddigkeit, L., Deursen, R.Van, Blum, L.C. and Reymond, J., Enumeration of 166 Billion Organic Small Molecules in the Chemical Universe Database GDB-17. J. Chem. Inf. Model., 52(11), pp. 2864-2875, 2012. DOI: 10.1021/ci300415d [ Links ]

[3] Lipinski, C.A., Lombardo, F., Dominy, B.W. and Feeney, P.J., Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings. Adv Drug Deliv Rev., 46(1-3), pp. 3-26. DOI: 10.1016/s0169-409x(00)00129-0. [ Links ]

[4] Chem, M. and Hann, M.M., Molecular obesity , potency and other addictions in drug discovery. Med Chem Comm., 2(5), pp. 349-355, 2011. DOI: 10.1039/c1md00017a [ Links ]

[5] Bolten, B.M. and DeGregorio, T., From the analyst’s couch. Trends in development cycles. Nat Rev Drug Discov. 1(5), pp. 335-336, 2002. DOI: 10.1038/nrd805 [ Links ]

[6] Dearden, J.C., In silico prediction of drug toxicity. J Comput Aided Mol Des., 17(2), pp. 119-127, 2003. DOI: 10.1023/A:1025361621494 [ Links ]

[7] Torres, J,. Python deep learning: introducción práctica con Keras y TensorFlow 2. Marcombo; [online]. 2020. Available at: https://books.google.com.co/books?id=5vpmzQEACAAJ. [ Links ]

[8] Ferdousi, R., Safdari, R. and Omidi, Y., Computational prediction of drug-drug interactions based on drugs functional similarities. J Biomed Inform., 70, pp. 54-64, 2017. DOI: 10.1016/j.jbi.2017.04.021 [ Links ]

[9] Goodfellow, I., Bengio, Y. and Courville, A., Deep Learning. MIT Press, [online]. 2016. Available at: www.deeplearningbook.org [ Links ]

[10] LeCun, Y., Kavukcuoglu, K. and Farabet, C., Convolutional networks, and applications in vision. In: Proceedings of 2010 IEEE International Symposium on Circuits and Systems; 2010, pp. 253-256. DOI: 10.1109/ISCAS.2010.5537907 [ Links ]

[11] Yu, S., Member, S., Wickstrøm, K and, Jenssen, R., Pr C. Understanding convolutional neural networks with Information Theory: An Initial Exploration. 2020, pp. 1-11. arXiv:1804.06537v5. [ Links ]

[12] Ellison, N., Goodman & Gilman’s The Pharmacological Basis of therapeutics, 10th Ed., Anesthesia & Analgesia, [online]. 94(5), 1377 P, 2002. DOI: 10.1097/00000539-200205000-00085. Available at:https://journals.lww.com/anesthesiaanalgesia/Fulltext/2002/05000/Goodman_Gilman_s_The_Pharmacological_Basis_of.85.aspx. [ Links ]

[13] Aliper, A., Plis, S., Artemov, A., Ulloa, A., Mamoshina, P. and Zhavoronkov, A., Deep learning applications for predicting pharmacological properties of drugs and drug repurposing using transcriptomic data. Mol Pharm. 13(7), pp. 2524-2530, 2016. DOI: 10.1021/acs.molpharmaceut.6b00248 [ Links ]

[14] Rogers, D. and Hahn, M., Extended-Connectivity fingerprints. J Chem Inf Model. 50(5), pp. 742-754, 2010. DOI: 10.1021/ci100050t. [ Links ]

[15] Breiman, L., Random forests. Mach Learn. 45(1), pp. 5-32, 2001. DOI: 10.1023/A:1010933404324 [ Links ]

[16] Meyer, J.G., Liu, S., Miller, I.J., Coon, J.J. and Gitter, A., Learning Drug functions from chemical structures with convolutional neural networks and random forests. J Chem Inf Model. 59(10), pp. 4438-4449, 2019. DOI: 10.1021/acs.jcim.9b00236 [ Links ]

[17] Lengauer, T. and Rarey, M., Computational methods for biomolecular docking. Curr Opin Struct Biol. 6(3), pp. 402-406, 1996. DOI: 10.1016/S0959-440X(96)80061-3 [ Links ]

[18] Jorgensen, W.L., Rusting of the lock and key model for protein-ligand binding. Science. 254(5034), pp. 954-955, 1991. DOI: 10.1126/science.1719636 [ Links ]

[19] Meng, E.C., Shoichet, B.K. and Kuntz, I.D., Automated docking with grid-based energy evaluation. J. Comput. Chem., 13(4), pp. 505-524, 1992. DOI: 10.1002/jcc.540130412. [ Links ]

[20] Wei, B.Q., Weaver, L.H., Ferrari, A.M., Matthews, B.W. and Shoichet, B.K., Testing a flexible-receptor docking algorithm in a model binding site. J Mol Biol.,337(5), pp. 1161-1182, 2004. DOI: 10.1016/j.jmb.2004.02.015 [ Links ]

[21] Shoichet, B.K., Bodian, D.L. and Kuntzt, I.D., Molecular docking using shape descriptors. J. Comput. Chem., 13(3), pp. 380-397, 1992. DOI: 10.1002/jcc.540130311. [ Links ]

[22] Jiménez, J., Škalič, M., Martínez-Rosell, G. and De Fabritiis, G., KDEEP: protein-ligand absolute binding affinity prediction via 3D-convolutional neural networks. J Chem Inf Model, 58(2), pp. 287-296, 2018. DOI: 10.1021/acs.jcim.7b00650 [ Links ]

[23] Lowe, H.J. and Barnett, G.O., Understanding and using the medical subject headings (MeSH) vocabulary to perform literature searches. JAMA. 271(14), pp. 1103-1108, 1994. [ Links ]

[24] Gitter, A., Learning drug functions from chemical structures with convolutional neural networks and random forests. J. Chem. Inf. Model., 59(10), pp. 4438-4449, 2019. DOI: 10.1021/acs.jcim.9b00236 [ Links ]

[25] Ragoza, M., Hochuli, J., Idrobo, E., Sunseri, J. and Koes, D.R., Protein-ligand scoring with convolutional neural networks. J Chem Inf Model. 57(4), pp. 942-957, 2017. DOI: 10.1021/acs.jcim.6b00740 [ Links ]

[26] Kim, S., Chen, J., Cheng, T., et al., PubChem in 2021: new data content and improved web interfaces. Nucleic Acids Res. 49(D1), pp. D1388-D1395, 2021. DOI: 10.1093/nar/gkaa971 [ Links ]

[27] Anderson, E., Veith, G.D., Weininger, D. and Environmental Research Laboratory (Duluth, Minn.). , SMILES, a Line Notation and Computerized Interpreter for Chemical Structures. Environmental research brief.. U.S. Environmental Protection Agency, Environmental Research Laboratory, Ed., [online]. 1987, 4P, Available at: https://books.google.com.co/books?id=KSofvgAACAAJ. [ Links ]

[28] Bloice et al., Augmentor: an image augmentation library for machine learning. Journal of Open Source Software, 2(19), art. 432, 2017. DOI: 10.21105/joss.00432 [ Links ]

[29] Van Rossum, G. and Drake, F.L., Python 3 reference manual. Create Space, Ed., Scotts Valley CA, USA, 2009. [ Links ]

[30] Helson, H., Structure Diagram generation. Rev. Comp. Chem., 13, pp. 313-398, 2007, DOI: 10.1002/9780470125908.ch6 [ Links ]

[31] Colomer, M.C., Medicamentos de vanguardia. Offarm: Farmacia y Sociedad, 21(10), pp. 175-178, 2002. [ Links ]

J.M. Martínez-Conde, es Estadístico de la Universidad de Córdoba, Esp. en Gerencia de Riesgos y Seguros y MSc. en Estadística Aplicada de la Universidad Tecnológica de Bolívar,Colombia. Desde el 2015 se desempeña como docente de hora catedra para la Universidad de Córdoba y docente tiempo completo para la Universiad del Sinú. Su interés incluye el machine learning, deep learning y la programación estadística. ORCID: 0000-0002-0257-875X

A. Patiño-Vanegas, es Lic. en Matemáticas y Física de la Universidad Popular del Cesar, Colombia, MSc. en Física de la Universidad Industrial de Santander, Colombia y Dr. en Ciencias para el Ingeniero de la Universidad de Bretaña Sur, Francia. Es profesor de tiempo completo de la Universidad Tecnológica de Bolívar, Colombia y pertenece al grupo de investigación en Física Aplicada y Procesamiento de Imágenes y Señales (FAPIS). Su línea de investigación está principalmente en el campo de la óptica y el tratamiento de imágenes y señales. ORCID: 0000-0001-5783-192X

How to cite: Martínez-Conde, J.M. and Patiño-Vanegas, A., Aprendizaje del uso terapéutico de fármacos a partir de la información espacial tridimensional de su estructura molecular con redes neuronales convolucionales.. DYNA, 88(219), pp. 247-255, October - December, 2021.

Received: January 14, 2021; Revised: September 02, 2021; Accepted: September 22, 2021

The author; licensee Universidad Nacional de Colombia

Services on Demand

Journal

Article

Indicators

Related links

Share

DYNA

Print version ISSN 0012-7353On-line version ISSN 2346-2183

Dyna rev.fac.nac.minas vol.88 no.219 Medellín Oct./Dec. 2021 Epub Mar 15, 2022

https://doi.org/10.15446/dyna.v88n218.92778