Las proteínas tienen multitud de aplicaciones científicas, médicas e industriales. Ahora un equipo científico del Centro de Regulación Genómica (CRG) ha comenzado a trabajar en la construcción de ATHENA, una inteligencia artificial (IA) generativa que puede diseñar proteínas con propiedades personalizadas.
El proyecto, liderado por la Dra. Noelia Ferruz, se ha anunciado hoy y cuenta con el apoyo de una Starting Grant de 1,5 millones de euros del Consejo Europeo de Investigación. ATHENA ayudará a diseñar nuevas proteínas que actualmente no existen, con propiedades que pueden ir más allá de las que se encuentran en la naturaleza. Por ejemplo, se puede utilizar para crear enzimas que aislan el dióxido de carbono de la atmósfera. Otro tipo de proteína podría unirse a las moléculas de BPA, ayudando a detectar y eliminar los contaminantes dañinos del medio ambiente.
"Aunque el conjunto de herramientas que existen en la naturaleza es vasto y asombroso, no siempre proporciona las soluciones precisas que necesitamos. Las proteínas que puedan ayudar a hacer frente a retos como el cambio climático o la contaminación ambiental siguen sin descubrirse o simplemente no existen. Queremos construir herramientas que puedan fabricar estas proteínas, proporcionando formas completamente nuevas de abordar estos retos", explica la Dra. Noelia Ferruz, líder de grupo en el Centro de Regulación Genómica y coordinadora del proyecto ATHENA.
“Los datos ayudarán a ATHENA trabajar con proteínas de una manera que no es posible en este momento, para diseñar nuevas proteínas con propiedades específicas”
ATHENA es una herramienta de inteligencia artificial generativa. El ejemplo más famoso de este tipo de tecnología disruptiva y rápido crecimiento es ChatGPT, que puede procesar y generar lenguaje humano en forma escrita. Los grandes modelos de aprendizaje de idiomas, como ChatGPT, se entrenan utilizando conjuntos de datos basados en texto y tienen la capacidad de aprender, mejorando con el tiempo.
ATHENA se entrenará de forma parecida, pero utilizando el "lenguaje" de las proteínas. Sin embargo, en lugar de solo texto, se utilizarán múltiples tipos de datos de las proteínas, incluida su secuencia (el orden de los aminoácidos), estructuras tridimensionales (cómo se forman las proteínas), dinámica (cómo se mueven) e información funcional (qué hacen).
"Esto es como construir una IA con texto, imágenes y videos a la vez. Los diferentes tipos de datos ayudarán a ATHENA a comprender y trabajar con proteínas de una manera que no es posible en este momento, lo que lo hace mucho más versátil y potente en el diseño de nuevas proteínas con propiedades específicas", afirma la Dra. Ferruz.
El equipo de investigación utilizará el aprendizaje por refuerzo, una técnica de IA, para construir ATHENA. Este es un enfoque que refleja el aprendizaje de los humanos con la experiencia, lo que permite que el modelo mejore a partir de la retroalimentación. Ayudará mejorar iterativamente sus diseños de proteínas basados en experimentos de laboratorio, lo que hace que cada diseño posterior tenga más probabilidades de éxito.
"Queremos ser capaces de ver el interior del modelo de IA para entender cómo toma decisiones, en lugar de limitarse a aceptar sus resultados”
Por ejemplo, ATHENA podría crear una proteína con una capacidad mejorada para capturar dióxido de carbono. A continuación, las proteínas se sintetizan y se prueban en un laboratorio. Si una proteína funciona bien, la IA es "recompensada", mientras que las proteínas que fracasan ayudarán a ajustar los parámetros del modelo, y así evitar que vuelva a cometer los mismos errores.
Uno de los retos de la IA es que los modelos suelen funcionar como cajas negras, lo que significa que no sabemos exactamente cómo toman decisiones. Una de las características únicas de ATHENA es que el equipo de investigación lo diseñará utilizando "IA explicable", un proceso que hace que el sistema sea más transparente y comprensible para los humanos.
"Queremos ser capaces de ver el interior del modelo de IA para entender cómo toma decisiones, en lugar de limitarse a aceptar sus resultados. Esto es importante porque permite a las personas confiar en la tecnología, aprender de ella y asegurarse de que está tomando decisiones por las razones correctas. Este será uno de los mayores retos del proyecto", concluye la Dra. Ferruz.
El proyecto ATHENA es una iniciativa de cinco años respaldada por una Starting Grant de 1,5 millones de euros del Consejo Europeo de Investigación (ERC), la principal iniciativa de financiación de la investigación creada por la Unión Europea. El ERC ha anunciado 494 proyectos en su última ronda de financiación, 33 de los cuales se han destinado a investigadores e investigadoras en España.