Un estudio publicado en la revista Nature aporta nuevas claves para entender esta gran cantidad de ADN desconocido, revelando su importancia funcional y evolutiva. El trabajo, dirigido por el Dr. Jaime Huerta Cepas del grupo de Genómica Comparada y Metagenómica del Centro de Biotecnología y Genómica de Plantas (UPM-INIA/CSIC), un centro mixto entre el Centro Nacional INIA del Consejo Superior de Investigaciones Científicas (CSIC) y la Universidad Politécnica de Madrid (UPM), aporta un extenso catálogo de nuevas familias génicas y destaca la necesidad de incorporar esta información en futuros estudios metagenómicos.
El Dr. Huerta-Cepas señala que, aunque las bases de datos metagenómicas actuales contienen millones de secuencias de ADN desconocido que codifican para nuevos genes, la falta de información sobre su origen y relevancia biológica ha limitado enormemente su integración en los estudios sobre el microbioma. Según el Dr. Huerta-Cepas, la caracterización de esta enorme cantidad de nuevos genes nos permitirá no sólo descubrir nuevas funciones moleculares, sino comprender mejor las interacciones entre los microorganismos y su entorno.
El trabajo impulsa el descubrimiento de nuevas funciones moleculares y mejora la comprensión de las interacciones entre el microbioma y su entorno
En el trabajo, se examinaron más de 149.000 genomas microbianos obtenidos de diversos ambientes, logrando establecer un catálogo de aproximadamente 400,000 nuevas familias génicas. El Dr. Álvaro Rodríguez del Río, autor principal de la investigación, comenta como, mediante técnicas de genómica comparada y filogenética, han conseguido identificar muchos genes que, a pesar de estar ausentes en microorganismos ya conocidos, son altamente prevalentes en diferentes ecosistemas y están sometidos a una fuerte presión selectiva. Según el Dr. Rodríguez del Río, la identificación de estas familias génicas se basó en filtros muy estrictos, llegando a descartar más del 90% del material genético disponible. Aún así, el catálogo publicado consigue triplicar la cantidad de familias génicas microbianas conocidas hasta la fecha.
Este exhaustivo análisis del microbioma proporciona además información funcional de más de 130.000 de nuevas familias génicas. Para ello, se utilizaron diversos análisis de conservación genómica y técnicas de predicción de estructura de proteínas basadas en inteligencia artificial. El trabajo destaca la aplicación práctica de estas predicciones en el descubrimiento y caracterización de nuevas funciones moleculares, llegando a validar experimentalmente varios nuevos genes involucrados en los mecanismos de movilidad y defensa de los microorganismos.
“Este estudio abre nuevas vías para una mejor comprensión de los mecanismos que gobiernan la relación entre microbioma y salud”
Por último, el artículo demuestra cómo esta gran cantidad de material genético, hasta ahora ignorado, permite mejorar los estudios de asociación entre el microbioma y su entorno. En particular, el estudio revela cómo la abundancia de algunos de estos nuevos genes varía de forma significativa en el microbioma intestinal de pacientes con cáncer de colon. Este descubrimiento no solo promete mejorar las técnicas de diagnóstico, sino que también abre nuevas vías para una mejor comprensión de los mecanismos que gobiernan la relación entre microbioma y salud.
En el trabajo ha participado un equipo interdisciplinar de investigadores del CBGP especializados en biología computacional (Dr. Jaime Huerta-Cepas, Dr. Álvaro Rodríguez del Río, Dr. Joaquín Giner Lamia, Dr. Carlos Pérez Cantalapiedra, Ana Hernandez Plaza, Ziqi Deng y Jorge Botas), así como varios miembros del grupo liderado por la Dra. Emilia Lopez Solanilla (Martí Munar-Palmer, Dra. Saray Santamaría-Hernando y Dr. José J. Rodríguez Herva), encargados de realizar las validaciones experimentales de algunos de los nuevos genes microbianos identificados. Además, este estudio han contando con la colaboración de los laboratorios dirigidos por el Dr. Luis Pedro Coelho (Fudan University, China), el Dr. Sinichi Sunagawa (ETH, Suiza) y el Dr. Peer Bork (EMBL, Alemania), implicados en el minado de datos metagenómicos y la predicción de estructuras proteicas.
Esta investigación ha contado con financiación del proyecto Centro de Excelencia Severo Ochoa del CBGP (UPM-INIA/CSIC), del programa INPhINIT de la Fundación La Caixa y fondos de la Agencia Estatal de Investigación y de la Agencia Estatal de Investigación y el Ministerio de Ciencia e Innovación.