Decodificar pensamiento en texto, el gran hito que ayuda a los que no pueden a comunicarse

Una gorra registra la actividad eléctrica del cerebro a través de su cuero cabelludo mediante un electroencefalograma para traducirla a texto

Demostración del sistema del Centro de Inteligencia Artificial centrado en humanos GrapheneX UTS de la Universidad Tecnológica de Sydney Fuente UTS
Demostración del sistema del Centro de Inteligencia Artificial centrado en humanos GrapheneX UTS de la Universidad Tecnológica de Sydney Fuente UTS
Diego Domingo
2 enero 2024 | 00:00 h

En un hito mundial, investigadores del Centro de Inteligencia Artificial Centrada en Humanos GrapheneX-UTS de la Universidad de Tecnología de Sídney (UTS) han logrado un avance científico que podría cambiar la vida de aquellos que han perdido la capacidad de hablar debido a enfermedades o lesiones. Se trata de un sistema portátil no invasivo capaz de decodificar pensamientos silenciosos y convertirlos en texto, proporcionando una herramienta invaluable para la comunicación en situaciones difíciles.

El equipo de investigación, liderado por el CT Lin, Director del Centro HAI GrapheneX-UTS, ha desarrollado un sistema que utiliza la actividad eléctrica cerebral registrada a través de un electroencefalograma (EEG) para traducir pensamientos en palabras y oraciones. Este enfoque revolucionario elimina la necesidad de métodos invasivos como la implantación de electrodos en el cerebro, ofreciendo una alternativa más accesible y menos invasiva.

Esta tecnología podría usarse en personas que han perdido el habla o para el control de brazos biónicos con la mente

La aplicación potencial de esta tecnología es amplia y tiene la posibilidad de marcar una diferencia significativa en la vida de las personas. En particular, podría ser un cambio radical para la vida de aquellos que han perdido la capacidad de hablar debido a enfermedades como el accidente cerebrovascular o que han sufrido la amputación de alguna extremidad, ya que este avance abre la puerta a una comunicación más fluida y directa entre humanos y máquinas, permitiendo operar dispositivos como brazos biónicos o robots mediante la mente.

Este estudio, que ha sido destacado en la prestigiosa conferencia NeurIPS, conocida por presentar investigaciones líderes en inteligencia artificial y aprendizaje automático, representa un avance significativo en el campo de la decodificación cerebral. El profesor Lin destacó que este esfuerzo pionero logra traducir directamente las ondas cerebrales en lenguaje, introduciendo una innovadora técnica de decodificación neural.


En el experimento, los participantes utilizaron un gorro que registraba la actividad eléctrica cerebral mientras leían pasajes de texto en silencio. El EEG capturó patrones y características específicas del cerebro, y estos datos fueron procesados por un modelo de inteligencia artificial llamado DeWave, desarrollado por el equipo de investigación. DeWave demostró ser capaz de traducir las señales EEG en palabras y oraciones, aprendiendo de grandes cantidades de datos EEG.

Una característica destacada de este enfoque es su capacidad para prescindir del seguimiento ocular, una limitación común en las tecnologías anteriores. Esto significa que lanueva tecnología es más versátil y puede ser utilizada por un grupo más amplio de personas. A diferencia de métodos anteriores que requerían cirugía para implantar electrodos en el cerebro o escáneres de resonancia magnética voluminosos y costosos, esta innovación permite una aplicación más sencilla y cotidiana.

A diferencia de los avances anteriores esta tecnología prescinde del seguimiento ocular lo que la hace más versátil

“El modelo es más hábil para unir verbos que sustantivos. Sin embargo, cuando se trata de sustantivos, notamos una tendencia hacia el uso de sinónimos en lugar de traducciones precisas, como 'el hombre' en lugar de 'el autor'”, afirmó Yiqun Duan, primer autor del estudio. “Creemos que esto se debe a que cuando el cerebro procesa estas palabras semánticamente similares pueden producir patrones de ondas cerebrales parecidas. A pesar de los desafíos, nuestro modelo produce resultados significativos, alineando palabras clave y formando estructuras de oraciones similares”, añadió. 

A pesar de estos desafíos, el modelo ha demostrado ser capaz de producir resultados significativos, alineando palabras clave y generando estructuras de oraciones similares. Esto abre la puerta a futuras investigaciones para mejorar la precisión y la versatilidad del sistema, acercándolo a niveles comparables a las tecnologías de traducción de lenguajes o reconocimiento de voz convencionales.

El rendimientodel modelo, según el estudio, es prometedor aunque con ciertas limitaciones. La precisión de la traducción actualmente se sitúa en alrededor del 40% según la puntuación BLEU-1, que mide la similitud del texto traducido por la máquina con traducciones de referencia de alta calidad. Aunque este porcentaje está por debajo de los niveles de precisión de las traducciones de lenguaje o reconocimiento de voz tradicionales, los investigadores son optimistas y esperan mejoras sustanciales en el futuro.

Los contenidos de ConSalud están elaborados por periodistas especializados en salud y avalados por un comité de expertos de primer nivel. No obstante, recomendamos al lector que cualquier duda relacionada con la salud sea consultada con un profesional del ámbito sanitario.
Lo más leído