Sobrevivente de AVC volta a falar com a ajuda de um implante experimental cérebro-computador
Melhorias nas interfaces cérebro1-computador estão aproximando a tecnologia da velocidade natural de uma conversação. Um implante2 de leitura cerebral que traduz sinais3 neurais em fala audível permitiu que uma mulher com paralisia4 ouvisse o que pretendia dizer quase instantaneamente.
Um estudo publicado na revista Nature Neuroscience descreve o teste dessa neuroprótese cérebro1-voz que restaura fala naturalista. O dispositivo funciona a partir de um modelo baseado em IA que transmite fala inteligível do cérebro1 em tempo real.
Embora ainda seja experimental, os pesquisadores esperam que a interface cérebro1-computador possa um dia ajudar a dar voz a quem não consegue falar.
Essa tecnologia também se mostrou compatível com diferentes tipos de interfaces cerebrais, desde eletrodos de alta densidade implantados no cérebro1 até métodos menos invasivos, como sensores colocados na face5 para registrar atividade muscular silenciosa. Isso abre caminho para aplicações clínicas mais amplas e acessíveis no futuro.
O dispositivo foi testado em uma mulher de 47 anos com tetraplegia que não conseguiu falar por 18 anos após um AVC. Os médicos o implantaram em seu cérebro1 durante uma cirurgia como parte de um ensaio clínico. Ele “converte sua intenção de falar em frases fluentes”, disse Gopala Anumanchipalli, PhD, co-autor do estudo.
Outras interfaces cérebro1-computador (ICCs) para fala normalmente apresentam um pequeno atraso entre os pensamentos das frases e a verbalização computadorizada. Esses atrasos podem interromper o fluxo natural da conversa, potencialmente levando a falhas de comunicação e frustração, disseram os pesquisadores.
Esse na verdade é o principal avanço do novo dispositivo: a superação do desafio técnico da latência6 entre o pensamento e a geração da fala. Os atrasos em estudos anteriores chegavam a até 8 segundos por frase, o que comprometia a fluidez da comunicação. Agora, com a nova abordagem de transmissão contínua (“streaming”), o sistema consegue produzir os primeiros sons em menos de 1 segundo após a intenção de fala, permitindo que o paciente continue se expressando sem interrupções.
Este é “um grande avanço em nossa área”, disse Jonathan Brumberg, PhD, do Laboratório de Fala e Neurociência Aplicada da Universidade do Kansas, que não participou do estudo.
Leia sobre "Acidente vascular cerebral7 em jovens".
Uma equipe na Califórnia registrou a atividade cerebral da mulher usando eletrodos enquanto ela pronunciava frases silenciosamente em seu cérebro1. Os cientistas usaram um sintetizador que construíram usando a voz dela antes do ferimento para criar um som de fala que ela teria falado.
O uso da voz original da paciente, gravada antes do AVC, teve um impacto significativo na experiência subjetiva relatada. Segundo os pesquisadores, ouvir sua própria voz em tempo quase real aumentou a sensação de controle e identidade para a paciente, fortalecendo seu vínculo com a comunicação restaurada.
Os cientistas treinaram um modelo de inteligência artificial que traduz a atividade neural em unidades de som. Ele funciona de forma semelhante aos sistemas existentes usados para transcrever reuniões ou ligações telefônicas em tempo real, disse Anumanchipalli, da Universidade da Califórnia, Berkeley.
O implante2 em si fica no centro da fala do cérebro1, de modo que ele ouve, e esses sinais3 são traduzidos em trechos de fala que formam as frases. É uma “abordagem de streaming”, disse Anumanchipalli, com cada trecho de 80 milissegundos de fala (cerca de meia sílaba) enviado para um gravador.
“Não se trata de esperar que uma frase termine”, disse Anumanchipalli. “É processá-la em tempo real.”
Decodificar a fala rapidamente tem o potencial de acompanhar o ritmo acelerado da fala natural, disse Brumberg. O uso de amostras de voz, acrescentou, “seria um avanço significativo na naturalidade da fala.”
Os pesquisadores também avaliaram se o modelo era capaz de generalizar o aprendizado, ou seja, produzir palavras que não faziam parte do vocabulário de treinamento. Usando termos pouco comuns, como os do alfabeto fonético da OTAN, o sistema conseguiu gerar sons precisos, indicando que o algoritmo estava de fato aprendendo as unidades fundamentais da fala humana, e não apenas repetindo padrões.
O próximo passo da pesquisa envolve o desenvolvimento de maior expressividade na fala sintetizada, incluindo variações de tom, volume e emoção. Esse refinamento é essencial para alcançar uma comunicação verdadeiramente naturalista, capaz de transmitir não apenas palavras, mas também sentimentos e intenções.
No artigo publicado, os pesquisadores descrevem a neuroprótese cérebro1-voz com streaming para restaurar a comunicação naturalista.
Eles contextualizam que a comunicação oral natural ocorre instantaneamente. Atrasos na fala superiores a alguns segundos podem interromper o fluxo natural da conversa. Isso dificulta a participação de indivíduos com paralisia4 em diálogos significativos, podendo levar a sentimentos de isolamento e frustração.
Neste estudo, utilizou-se gravações de superfície de alta densidade do córtex sensório-motor da fala em uma participante de um ensaio clínico com paralisia4 grave e anartria para acionar um sintetizador de fala naturalista com streaming contínuo.
Os pesquisadores projetaram e utilizaram modelos de transdutores de rede neural recorrente com aprendizado profundo para obter síntese de fala fluente e inteligível com amplo vocabulário online, personalizada para a voz pré-lesão8 da participante, com decodificação neural em incrementos de 80 ms.
Offline, os modelos demonstraram capacidades implícitas de detecção de fala e puderam decodificar a fala continuamente por tempo indeterminado, permitindo o uso ininterrupto do decodificador e aumentando ainda mais a velocidade.
Essa estrutura também foi generalizada com sucesso para outras interfaces de fala silenciosa, incluindo gravações de unidade única e eletromiografia9.
Essas descobertas introduzem um paradigma neuroprotético de fala para restaurar a comunicação falada naturalista para pessoas com paralisia4.
Veja também sobre "Deficiência física" e "Tetraplegia: o que é".
Fontes:
Nature Neuroscience, publicação em 31 de março de 2025.
MedPage Today, notícia publicada em 31 de março de 2025.
UC Berkeley Engineering, notícia publicada em 31 de março de 2025.