Lemon, la herramienta que podría ayudar al aprendizaje automático a crear mejores medicamentos

Limones. / Archivo.
Limones. / Archivo.

Los investigadores del descubrimiento de fármacos han creado un nuevo marco para extraer datos para entrenar modelos de aprendizaje automático.

Lemon, la herramienta que podría ayudar al aprendizaje automático a crear mejores medicamentos

Uno de los desafíos en el uso del aprendizaje automático para el desarrollo de medicamentos es crear un proceso para que la computadora extraiga la información necesaria de un grupo de puntos de datos. Los científicos de drogas deben extraer datos biológicos y entrenar el software para comprender cómo un cuerpo humano típico interactuará con las combinaciones que se unen para formar un medicamento.

Los investigadores de descubrimiento de drogas de la Universidad de Purdue han creado un nuevo marco para extraer datos para entrenar modelos de aprendizaje automático. El marco, llamado Lemon, ayuda a los investigadores de drogas a explotar mejor la Base de Datos de Proteínas (PDB), un recurso integral con más de 140.000 estructuras biomoleculares y con nuevas que se lanzan cada semana. El trabajo se publica en la edición del 15 de octubre de Bioinformatics.

"PDB es una herramienta esencial para la comunidad de descubrimiento de drogas", dijo Gaurav Chopra, profesor asistente de química analítica y física en la Facultad de Ciencias de Purdue que trabaja con otros investigadores en el Instituto Purdue para el Descubrimiento de Drogas y dirigió el equipo que creó Lemon. "El problema es que puede tomar una enorme cantidad de tiempo clasificar todos los datos acumulados. El aprendizaje automático puede ayudar, pero aún necesita un marco sólido desde el cual la computadora pueda analizar rápidamente los datos para ayudar a crear de manera segura y efectiva drogas ".

La plataforma de software Lemon es una biblioteca rápida de C ++ 11 con enlaces de Python que extrae el PDB en minutos. La carga de todos los archivos mmCIF tradicionales en el PDB lleva unos 290 minutos, pero Lemon lo hace en unos seis minutos cuando aplica un flujo de trabajo simple en una máquina de 8 núcleos. Lemon permite al usuario escribir funciones personalizadas, incluirlas como parte de su paquete de software y desarrollar funciones personalizadas de manera estándar para generar conjuntos de datos de evaluación comparativa únicos para toda la comunidad científica.

"Las estructuras experimentales depositadas en PDB han resultado en varios avances para las comunidades científicas y educativas de biología estructural y computacional que ayudan a avanzar en el desarrollo de medicamentos y otras áreas", dijo Jonathan Fine, un estudiante de doctorado en química que trabajó con Chopra para desarrollar la plataforma. "Creamos Lemon como una ventanilla única para extraer rápidamente todo el banco de datos y extraer la información biológica útil que es clave para el desarrollo de medicamentos".

Lemon obtuvo su nombre, ya que fue diseñado originalmente para crear conjuntos de evaluación comparativa para el software de diseño de fármacos e identificar los limones, interacciones biomoleculares que no se pueden modelar bien, en el PDB.

El trabajo de desarrollo de software es el último proyecto que involucra innovaciones en salud de Chopra y su equipo. Lemon está disponible gratuitamente en GitHub.

Chopra también trabajó con la Oficina de Comercialización de Tecnología de la Fundación de Investigación Purdue para patentar otras innovaciones de su laboratorio.  @mundiario

 

 

Lemon, la herramienta que podría ayudar al aprendizaje automático a crear mejores medicamentos
Comentarios