El aprendizaje automático puede proporcionar una predicción de los datos de casos epidémicos con una precisión sorprendentemente buena, según ha demostrado un nuevo estudio de la Universidad de Ciencia y Tecnología King Abdullah (Arabia Saudí).
La prueba de concepto, publicada en la revista científica 'Scientific Reports', demuestra un prometedor enfoque alternativo a los modelos mecanicistas convencionales basados en parámetros que elimina el sesgo humano y las suposiciones del análisis y muestra la historia subyacente de los datos.
Trabajando con modelos de inteligencia artificial, desarrollaron un marco que se ajustara a las características y a la naturaleza evolutiva de los datos de la epidemia, utilizando datos de incidencia y recuperación de COVID-19 de la India y Brasil que se han hecho públicos.
"Estudiamos si el método de regresión del proceso gaussiano sería útil para predecir la propagación de la pandemia, ya que ofrece intervalos de confianza para las predicciones, lo que puede ayudar mucho a los responsables de la toma de decisiones", explica el líder del trabajo, Yasminah Alal.
La previsión precisa de los casos durante una pandemia es esencial para ayudar a mitigar y frenar la transmisión.
Se han desarrollado varios métodos para mejorar la previsión de la propagación de los casos mediante modelos matemáticos y de series temporales, pero éstos se basan en una comprensión mecánica de cómo se propaga el contagio y la eficacia de las medidas de mitigación, como las mascarillas y el aislamiento.
Estos métodos son cada vez más precisos a medida que mejora nuestra comprensión de un contagio concreto, pero esto puede dar lugar a suposiciones erróneas que podrían afectar, sin saberlo, a la precisión de los resultados de la modelización.
Como las técnicas de aprendizaje automático no son capaces de captar la dependencia temporal de una serie de datos, el equipo tuvo que idear una forma de incorporar dinámicamente nuevos datos en diferentes puntos del proceso de aprendizaje "retrasando" las entradas de datos.
También incorporaron un método de optimización bayesiana que permite refinar las distribuciones extraídas para aumentar su precisión. El resultado es un marco de aprendizaje automático dinámico integrado que funcionó notablemente bien utilizando datos de casos reales.
"En este estudio, empleamos modelos de aprendizaje automático por su capacidad para extraer información relevante de los datos con flexibilidad y sin ninguna suposición respecto a la distribución de datos subyacente", remachan los autores.