Los avances que se están produciendo en el campo de la medicina nos acercan a un futuro en el que diagnóstico y tratamiento se abordarán cada vez más de una manera personalizada. Un nuevo escenario en el que el procesamiento de datos, la Inteligencia Artificial (AI) y la supercomputación jugarán un papel imprescindible.
Un contexto que ha servido de base para el seminario científico organizado como parte del XI ciclo de seminarios científicos de la Fundación QUAES que ha contado con la participación del profesor Alfonso Valencia, ICREA, director del Departamento Life Sciences, Barcelona Supercomputing Center (BSC), director Instituto Nacional Bioinformática, nodo español de ELIXIR PI de IMPaCT-DATA.
El punto central de su exposición se ha focalizado en los datos como una oportunidad y un desafío en el desarrollo de la medicina genómica. “Los datos están creciendo mucho y la biología y la biomedicina son dos áreas en las que los datos están creciendo de forma notable”, ha comenzado su presentación señalando que “se trata de datos que están provistos a través de muchos proveedores pequeños”.
Hablamos de unos datos complejos “porque están asociados a detalles de los métodos que se han utilizado para obtenerlos y reflejan una realidad más compleja, con mayor interrelación”. Nos encontramos en un momento en el que empezamos a tener una necesidad palpable de conectar de forma más profunda los ámbitos de la medicina y la práctica médica con el mundo de la investigación de los datos. “Necesitamos los datos primarios, de los pacientes”, ha destacado señalando que se establecen “complejas interacciones”.
El acceso a los datos plantea una serie de cuestiones sobre las que se debe prestar atención como las barreras que supone su acceso, calidad y cómo hacerlos interoperables, legislación en materia de protección de datos, almacenamiento y cómo podemos hacer sostenible todo este entramado de proveedores y consumidores de datos.
Valencia ha puesto el foco en el proyecto IMPaCT-Data, centrado en la medicina de precisión impulsado por el Instituto de Salud Carlos III. Se fundamenta en tres ramas focalizadas en la medicina predictiva, ciencia de datos y medicina genómica. “El proyecto se centra en el desarrollo de un entorno de integración y análisis de datos. Para ello se propone un ciclo de prueba, evaluación e implementación de sistemas computacionales en los entornos sanitarios”.
“A lo que nosotros aspiramos es a que un usuario pueda sentarse delante de su pantalla y hacer preguntas completas”, ha afirmado. “Esto debe pasar porque el usuario no tendría que preocuparse sobre aspectos como dónde están los datos o cómo se está realizando la computación. Estas operaciones deberían ser transparentes para el usuario. Es por esto que nuestro objetivo final es hacer que la bioinformática sea invisible”
IMPaCT-Data tiene la vocación de crear infraestructura para el uso secundario de los datos de los sistemas sanitarios españoles: historias clínicas electrónicas, imagen médica y repositorios genómicos y “contribuir al sistema sanitario con el conocimiento y la metodología generado”. Los principales objetivos de IMPaCT son:
- Desarrollo de la primera iteración de una plataforma de datos federada de datos biomédicos.
- Desarrollo de protocolos, métodos y sistemas integrados de análisis de datos, incluyendo FAIRificación.
- Desarrollo inicial para la extracción (semi)automática y segura de información de los sistemas de información de los sistemas de información sanitarios, incluyendo la historia clínica electrónica.
- Liderar el portfolio de recursos bioinformáticos ofrecidos por España a ELIXIR (infraestructura europea de bioinformática).
- Desarrollo de protocolos de integración del análisis genómico, imagen y HCE.
- Desarrollo de la primera versión de una infraestructura de computación en la nube para dar soporte a IMPaCT.
- Desarrollo inicial para monitorizar los procesos de tratamiento y evaluación de calidad de datos.
- Incorporación de información genética y genómica.
- Extracción de información cuantitativa de imágenes médicas.
- Implementación de “demostradores” sobre funciones avanzadas de interoperabilidad de información traslacional.
- Evaluación y ejecución concertada de los demostradores de gestión en colaboración con la red TransBioNet y otros actores del sistema de salud.
“Creemos que podemos crear un espacio de datos biomédicos para su uso en investigación”, ha expuesto. Compartir datos médicos y genómicos es esencial para poder progresar en la investigación biomédica con sus implicaciones para la salud, ganando en cantidad, diversidad y calidad de información.
Valencia ha asegurado que uno de los principales problemas a los que nos enfrentamos en este camino es la interoperabilidad semántica, es decir, “saber que los datos procedentes de dos hospitales realmente están hablando de las mismas variables”.
“A lo que nosotros aspiramos es a que un usuario pueda sentarse delante de su pantalla y hacer preguntas completas”, ha afirmado. “Esto debe pasar porque el usuario no tendría que preocuparse sobre aspectos como dónde están los datos o cómo se está realizando la computación. Estas operaciones deberían ser transparentes para el usuario. Es por esto que nuestro objetivo final es hacer que la bioinformática sea invisible”, ha concluido.