Un modelo de Inteligencia Artificial encuentra 70.000 virus de ARN nunca antes vistos

Un grupo de investigadores de China y Australia ha identificado, mediante su propio modelo de Inteligencia Artificial, 160.000 nuevas posibles especies de virus de ácido ribonucleico, entre ellas cerca de 70.000 que nunca antes se habían identificado

Virus (FOTO: Freepik)
Virus (FOTO: Freepik)
22 noviembre 2024 | 12:00 h

La Inteligencia Artificial (IA) sigue dando buenas noticias al campo de la investigación. Ahora, un grupo de científicos de la Universidad de Sun Yat-sen, en China, y de la Universidad de Sidney, en Australia, ha desarrollado un modelo informático de aprendizaje profundo que, escaneando datos genómicos recopilados por todo el mundo, logró identificar más de 160.000 nuevas posibles especies de virus de ácido ribonucleico (ARN). Entre ellas, cerca de 70.000 que nunca antes se habían identificado como especies “potencialmente novedosas”.

El nombre de la herramienta es LucaProt, y ha analizado 51 terabytes de datos, incluidas fuentes termales, suelo antártico, marismas y pilas de compost. “Se trata de un tesoro increíble”, afirma Eddie Holmes, biólogo evolutivo y virólogo de la Universidad de Sidney y autor principal del estudio junto a Mang Shi, de la Universidad de Sun Yat-sen. Todos los datos, además, están disponibles en el archivo público Sequence Read Archive, mantenido por el National Institutes of Health’s National Center for Biotechnology Information (NCBI).

Y es que los virus de ARN, además de abundantes, son muy cambiantes: a medida que se replican, los cambios en su genoma pueden acumularse rápidamente, y, con el tiempo, hacer que el virus no se parezca tanto a sus similares. De igual manera, muchos de ellos se encuentran en lo que se conoce como “materia oscura”, cuando tanto el ARN como el ADN no coinciden con ningún organismo conocido. Esto hace que sea mucho más difícil encontrarlos.

“Estamos en medio de un cambio revolucionario en nuestra comprensión del viroma y de la biodiversidad de los virus"

Por eso, para superar esta barrera, el grupo de investigadores aprovechó una cosa que todos los virus de ARN tienen en común: la enzima ARN polimerasa, un conjunto de enzimas capaces de emplear los ribonucleótidos para sintetizar ARN a partir de una secuencia de ADN que sirve como patrón o molde; en otras palabras: la proteína que los virus de ARN utilizan para copiar sus genomas cuando estos se replican. Debido a su función vital, su estructura se conserva muy bien, aunque la secuencia del gen que la codifica también puede variar mucho.

“Hemos entrenado a este modelo de Inteligencia Artificial para que reconozca la estructura de todas las ARN polimerasas conocidas, y encuentra montones y montones de ellas”, destaca Holmes sobre un programa al que tuvieron que preparar durante muchas semanas hasta llegar a ejecutarlo. Para ello, se asociaron con la empresa china Alibaba, y consiguieron algunos virus tan distintos del resto que podrían formar hasta 180 nuevos subgrupos por separado.

De hecho, afirma Holmes, descubrir un nuevo subgrupo es similar a descubrir un nuevo filo de animales, lo que significa que algunos son tan diferentes entre sí como lo son los cangrejos de las lombrices de tierra o los gatos de las medusas. El experto cree también que los nuevos virus podrían llevar a nuevas enzimas y proteínas útiles: por ejemplo, un virus que viva en una fuente termal tendría una ARN polimerasa que podría resistir a temperaturas extremas. “Si podemos descubrir cómo el ARN puede sobrevivir y replicarse a esa temperatura, si es que realmente lo hace, se trataría de una enzima realmente fascinante”, asegura Eddie Holmes.

VIRUS QUE YA NO SON INVISIBLES

El doctor Artem Babaian, virólogo de la Universidad de Toronto, indicó en una entrevista concedida a Fierce Biotech que el estudio llevado a cabo por sus homólogos de China y Australia es “histórico” no tanto por la amplitud del descubrimiento, sino por la “profundidad” con la que lo han realizado: “Se están centrando en estos virus de ARN que antes eran invisibles para los métodos estándar de alineación de secuencias”. “En vez de tener que predecir la estructura completa, y luego buscar una que implica un conjunto completamente diferente de herramientas, lo que han hecho esencialmente es cortar en la parte del aprendizaje profundo”, insiste Babaian, para quien esto no es más que la “punta del iceberg”.

“Estamos en medio de un cambio revolucionario en nuestra comprensión del viroma y de la biodiversidad de los virus, así como en comprender cómo los virus pueden afectar a nuestra salud aunque no causen enfermedades”, apunta el experto de la universidad canadiense. “Cuando uno se adentra en lo profundo, lo oscuro y lo desconocido, es cuando se logran avances significativos en Medicina. Tenemos que entender la interconexión de los virus con nosotros, con nuestro entorno y con las especies que nos rodean”, sentencia.

Los contenidos de ConSalud están elaborados por periodistas especializados en salud y avalados por un comité de expertos de primer nivel. No obstante, recomendamos al lector que cualquier duda relacionada con la salud sea consultada con un profesional del ámbito sanitario.