header-logo

Comunicación de marketing impulsada por inteligencia artificial

iCrowdNewswire Spanish

Automatización de diseño de la molécula para acelerar el desarrollo de fármacos. Modelo de máquina de aprendizaje podría ayudar a químicos a hacer moléculas con potencias más altas, mucho más rápidamente.

Jul 6, 2018 10:12 AM ET

El diseño de nuevas moléculas para la industria farmacéutica es principalmente un largo proceso manual que es propenso a errores. Pero los investigadores MIT han dado ahora un paso hacia automatizaba completamente el proceso de diseño, que podría drásticamente la velocidad de las cosas — y producir mejores resultados.

Descubrimiento de fármacos se basa en la optimización de plomo. En este proceso, químicos seleccionar una molécula blanco (“plomo”) con un potencial conocido para combatir una enfermedad específica, luego modificar sus propiedades químicas para mayor potencia y otros factores.

A menudo, químicos utilizar conocimientos expertos y realizar el ajuste manual de moléculas, añadiendo y sustrayendo los grupos funcionales, átomos y enlaces responsables de reacciones químicas específicas, uno por uno. Incluso si utilizan sistemas de predicen propiedades químicas óptimas, químicos aún necesitan hacer cada paso modificación ellos mismos. Esto puede tomar horas para cada iteración y todavía no puede producir a un candidato válido.

Investigadores de MIT Ciencias de la computación y laboratorio de Inteligencia Artificial (CSAIL) y Departamento de ingeniería eléctrica y Ciencias de computación (EECS) han desarrollado un modelo que selecciona mejor llevar candidatos molécula basados en propiedades deseadas. También modifica la estructura molecular necesaria para lograr una mayor potencia, asegurando al mismo tiempo la molécula sigue siendo químicamente válida.

El modelo básicamente toma como entrada los datos de estructura molecular y directamente crea gráficos moleculares — detalladas representaciones de una estructura molecular, con nodos que representan átomos y aristas que representan los bonos. Descompone los gráficos en grupos más pequeños de grupos funcionales válidos que utiliza como “bloques de construcción” que ayudan con más exactitud reconstruir y modificar mejor las moléculas.

“La motivación detrás de esto era sustituir el proceso ineficiente modificación humana de diseñar moléculas con iteración automática y asegurar la validez de las moléculas que generan,” dice Wengong Jin, estudiante de doctorado de CSAIL y principal autor de un libro describir el modelo que se presenta en la Conferencia Internacional de 2018 en el aprender de máquina en julio.

Junto a Jin en el papel son Regina Barzilay, el profesor de electrónica de Delta en el CSAIL y CEA y Tommi S. Jaakkola, Thomas Siebel profesor de ingeniería eléctrica y Ciencias de la computación en CSAIL, CEA y en el Instituto de datos, sistemas, y De la sociedad.

La investigación se realizó como parte del consorcio El aprender de máquina farmacéutica descubrimiento y síntesis entre MIT y ocho empresas farmacéuticas, anunciado en mayo. El consorcio identificados optimización de plomo como un desafío clave en el descubrimiento de medicamentos.

“Hoy en día, realmente es un arte, que requiere una gran cantidad de químicos capacitados para tener éxito, y eso es lo que queremos mejorar,” dice Barzilay. “El siguiente paso es llevar esta tecnología de academia para utilizar en casos de diseño reales farmacéutica y demostrar que pueden ayudar a químicos humanos haciendo su trabajo, que puede ser difícil”.

“Automatización del proceso también presenta nuevos retos de aprendizaje máquina,” dice Jaakkola. “Aprender a relacionar, modificar y generar gráficos moleculares unidades nuevas ideas técnicas y métodos.”

Generación de gráficos moleculares

Sistemas que intentan automatizar el diseño de la molécula han recortado en los últimos años, pero su problema es la validez. Esos sistemas, a menudo, dice Jin, generan moléculas que no son válidas bajo las reglas de la química y falla para producir moléculas con propiedades óptimas. Esto esencialmente hace plena automatización de diseño de la molécula sea.

Estos sistemas funcionan en notaciones lineales de moléculas, llamadas “sistemas de entrada de línea de entrada molecular simplificada”, o sonrisas, donde las largas cadenas de letras, números y símbolos representan átomos individuales o bonos que pueden ser interpretados por programas informáticos. Como el sistema modifica una molécula de plomo, amplía su representación de cadena símbolo por símbolo, átomo por átomo y enlace por enlace, hasta que genera una cadena de sonrisas final con potencia mayor de una propiedad deseada. Al final, el sistema puede producir una cadena de sonrisas final que parece válido bajo gramática de sonrisas, pero no es realmente válida.

Los investigadores resuelven este problema mediante la construcción de un modelo que se ejecuta directamente en los gráficos moleculares, en lugar de cadenas de sonrisas, que pueden ser modificados más eficiente y precisa.

Alimentar el modelo es un encargo autoencoder variacional — una red neuronal que “codifica” una molécula de entrada en un vector, que es básicamente un espacio de almacenamiento para datos estructurales de la molécula y luego “decodifica” ese vector en un gráfico que coincide con la entrada de la molécula.

En la fase de codificación, el modelo descompone cada gráfico molecular en racimos o “subgraphs,” cada uno de ellos representa un elemento específico. Tales racimos son construidos automáticamente por un concepto común de aprendizaje máquina, llamado descomposición del árbol, donde se asigna un gráfico complejo en una estructura de árbol de grupos, “que da un andamio de la gráfica original”, afirma Jin.

Dos andamios de estructura de árbol y estructura de grafo molecular están codificadas en sus vectores, donde las moléculas son grupo juntos por similitud. Esto hace que encontrar y modificar las moléculas de una tarea más fácil.

En la fase de decodificación, el modelo reconstruye el gráfico molecular en forma de “grueso a fino”, poco a poco aumentar la resolución de una imagen de baja resolución para crear una versión más refinada. Primero genera el andamio de estructura de árbol y luego reúne los grupos asociados (nodos en el árbol) juntos en un gráfico molecular coherente. De esta manera que el gráfico molecular reconstruido es una réplica exacta de la estructura original.

Para la optimización del plomo, el modelo puede modificar entonces plomo moléculas basadas en una propiedad deseada. Lo así con ayuda de un algoritmo de predicción partituras cada molécula con un valor de potencia de esa propiedad. En el papel, por ejemplo, los investigadores buscaron moléculas con una combinación de dos características: alta solubilidad y accesibilidad sintética.

Dada una propiedad deseada, el modelo optimiza una molécula de plomo mediante el algoritmo de predicción para modificar sus vectores — y, por lo tanto, la estructura — por grupos funcionales de la molécula para conseguir una mayor puntuación de la potencia de edición. Repite este paso para varias iteraciones, hasta que encuentra el puntaje más alto de la potencia prevista. Entonces, el modelo finalmente decodifica una nueva molécula del vector actualizado, con estructura modificada, mediante la compilación de todos los grupos correspondientes.

Válida y más potente

Los investigadores entrenan su modelo en gráficos moleculares 250.000 de la base de datos ZINC, una colección de estructuras moleculares 3D disponibles para uso público. Probaron el modelo de tareas para generar moléculas de válido, encontrar las mejores moléculas de plomo y diseñar nuevas moléculas con potencias de aumento.

En la primera prueba, modelo los investigadores genera moléculas químicamente válido 100% de una distribución de la muestra, en comparación con modelos de sonrisas que generan moléculas válido de 43 por ciento de la misma distribución.

La segunda prueba implicó dos tareas. En primer lugar, el modelo buscado un hotel en toda la colección de moléculas para encontrar la mejor molécula de plomo para las propiedades deseadas, solubilidad y accesibilidad sintética. En esa tarea, el modelo encuentra una molécula de plomo con una 30 por ciento mayor potencia que los sistemas tradicionales. La segunda tarea implicado modificar 800 moléculas para mayor potencia, pero son estructuralmente similar a la molécula de plomo. De esta manera, el modelo creado nuevas moléculas, muy parecidas a la estructura de plomo, con un promedio de más de 80 por ciento de mejora en potencia.

El objetivo siguiente de los investigadores para probar el modelo en más propiedades, más allá de solubilidad, que son más terapéuticamente relevantes. , Sin embargo, requiere más datos. “Las compañías farmacéuticas están más interesadas en propiedades que combaten contra objetivos biológicos, pero tienen menos datos sobre aquellos. Un desafío es desarrollar un modelo que puede trabajar con una cantidad limitada de datos de entrenamiento,”dijo Jin.

See Campaign: http://news.mit.edu/2018/automating-molecule-design-speed-drug-development-0706
Contact Information:
Rob Matheson

Tags:
, Wire, Artificial Intelligence Newswire, United States, Spanish

image


Keywords:  afds, afdsafds

Tags:  News