¿Seremos pronto capaces de leer la mente? Nuevo estudio decodifica imágenes de actividad cerebral para extraer palabras y significado

Cada vez es más realista, desde un punto de vista tecnológico, imaginar descifrar los pensamientos de los humanos. Por primera vez, los neurocientíficos pudieron "decodificar" datos de imágenes no invasivas de los cerebros de tres participantes para reconstruir secuencias de palabras y el significado general de las historias que los participantes habían escuchado, visto o imaginado.
En este nuevo estudio, publicado en Nature Neuroscience, Alexander Huth y sus colegas, de la Universidad de Texas, lograron extraer el significado general y también las oraciones de imágenes de actividad cerebral obtenidas por resonancia magnética funcional (o MRI funcional).
Decodificar el idioma
Sintetizar palabras a través de señales cerebrales podría ser muy útil para personas que no tienen acceso al habla debido a enfermedades como enfermedades de las neuronas motoras, que afectan a las neuronas que controlan los movimientos voluntarios del cuerpo. Esta investigación también plantea interrogantes sobre la existencia de nuestra vida privada más íntima, la de nuestros pensamientos.
Los patrones de decodificación del lenguaje, o "decodificadores del habla", buscan utilizar grabaciones de la actividad cerebral para deducir las palabras que los sujetos escuchan, dicen o imaginan.
Hasta ahora, los decodificadores de lenguaje solo se han utilizado sobre datos obtenidos de dispositivos implantados en el cerebro, lo que limita su utilidad. Y hasta ahora, los decodificadores que utilizan grabaciones no invasivas de la actividad cerebral han decodificado palabras sueltas o frases muy cortas, pero no se han aplicado para extraer significado del habla continua.
En esta nouvelle étude, se ha explotado una señal muy específica de la resonancia magnética funcional: esta señal depende del flujo de sangre en el cerebro y del nivel de oxigenación de la sangre.
Al centrarse en la actividad cerebral en las regiones del cerebro y en las redes neuronales que se sabe que procesan el lenguaje, los investigadores demostraron que su decodificador podría entrenarse para reconstruir el habla continua, incluidas palabras específicas pero también el significado agregado de oraciones más completas.
El decodificador usó las respuestas cerebrales de tres participantes registradas mientras escuchaban historias y generó secuencias de palabras que podrían haber producido la actividad cerebral registrada. Estas secuencias de palabras reproducían bastante bien la idea general de la historia, y en algunos casos incluso incluían palabras o frases exactas.
Dentro del escáner de resonancia magnética funcional, los participantes también vieron películas mudas e imaginaron las historias correspondientes. En ambos casos, el decodificador pudo predecir la mayoría de las historias.
Por ejemplo, un participante pensó "No he incurrido en mi licencia de conducir" (todavía no tengo mi licencia de conducir), y el decodificador predijo "Ella ni siquiera ha aprendido a conducir todavía" (Ni siquiera ha empezado a aprender a conducir todavía.).
Además, cuando los participantes tenían que escuchar activamente una historia mientras ignoraban una segunda historia transmitida simultáneamente, el decodificador solo podía identificar la primera trama.
Como funciona ?
Primero, los científicos pidieron a los participantes que pasaran 16 horas en un escáner de resonancia magnética funcional, donde escucharon la lectura de historias mientras se registraban sus actividades cerebrales.
Estas respuestas cerebrales se usaron para entrenar un "codificador", que es un modelo de computadora que predice cómo responde el cerebro a las palabras que escucha el participante. Después de este entrenamiento, el codificador puede predecir con buena precisión a qué respondería el cerebro de cada participante al escuchar una secuencia de palabras en particular.
Pero ir en la otra dirección, es decir, extraer una secuencia de palabras de la actividad cerebral, es mucho más difícil.
De hecho, el modelo codificador está diseñado para relacionar actividades cerebrales y “elementos semánticos” o el significado general de palabras o oraciones. Para lograr esto, el sistema utiliza el modelo de lenguaje "GPT", para transformador preentrenado generativo, el precursor del actual GPT-4. Luego, el decodificador genera la secuencia de palabras que podrían haber producido la respuesta cerebral observada.

La corrección de cada predicción del decodificador se comprueba usándola para calcular la actividad cerebral correspondiente. Esta actividad cerebral predicha por el decodificador se compara luego con la que realmente se registró.
Durante este proceso, que consume muchos recursos informáticos, se generan una a una muchas predicciones, y se clasifican según su precisión: se eliminan las predicciones inapropiadas, se mantienen las más precisas. Luego, se predice la siguiente palabra en secuencia, hasta que se determina la secuencia más correcta.
palabras y significado
El nuevo estudio muestra que, para llevar a cabo el proceso de predicción, se necesitaban datos de múltiples regiones del cerebro. Estas regiones son diversas pero muy específicas: son la red del habla, la región de asociación parietal/temporal/occipital y la corteza prefrontal.
Una diferencia importante entre este trabajo y estudios previos es el tipo de datos utilizados. De hecho, la mayoría de los decodificadores vinculan datos de las regiones del cerebro involucradas en la etapa final de la formación del habla, a saber, los movimientos de la boca y la lengua. Este decodificador trabaja a otro nivel, sobre las ideas y el significado de los pensamientos.
Una de las limitaciones de los datos de resonancia magnética funcional es su baja "resolución temporal". De hecho, la señal de oxigenación de la sangre sube y baja en unos 10 segundos, un período durante el cual escuchamos unas veinte palabras o más. Por lo tanto, esta técnica no detecta palabras individuales sino el significado probable de secuencias de palabras.
No entremos en pánico (todavía no)
La idea de que podemos leer la mente de forma natural plantea preocupaciones sobre la existencia de nuestra vida privada más íntima, lo que sucede en nuestras cabezas. Los investigadores realizaron experimentos adicionales para aclarar las capacidades de la técnica.
Estos experimentos muestran que todavía no hay necesidad de preocuparse de que nuestros pensamientos sean leídos cuando caminamos por la calle, o si no estamos dispuestos a cooperar.
De hecho, un decodificador entrenado con los datos del cerebro de una persona predice mal los elementos semánticos de los datos del cerebro de otra persona. Además, los participantes pueden complicar la tarea de decodificación dirigiendo su atención a otra tarea, como nombrar animales o contar otra historia.
El decodificador también funciona mal si los participantes se mueven en el escáner de resonancia magnética funcional, ya que esta es una técnica de imagen muy sensible al movimiento. La cooperación de los participantes es esencial aquí.
Con estas restricciones técnicas, además de la necesidad de computadoras muy poderosas para ejecutar el decodificador, es muy poco probable en esta etapa que los pensamientos de alguien puedan ser decodificados en contra de su voluntad en esta etapa.
Finalmente, el decodificador solo funciona por el momento con datos obtenidos por resonancia magnética funcional, que es una técnica costosa y, a menudo, difícil de implementar. El grupo de investigación tiene la intención de probar este método con datos de otras tecnologías de imágenes cerebrales no invasivas.
cristina maher, Ingeniero Biomédico y Neurocientífico, Universidad de Sydney
Este artículo ha sido publicado de nuevo. La conversación bajo licencia Creative Commons. Lee elarticulo original.
Crédito de la imagen: Shutterstock / PRODUCCIÓN DE ORION