Inteligência artificial permite que homem com paralisia digite apenas pensando em escrever à mão
Uma rede neural artificial pode interpretar sinais1 do cérebro2 de uma pessoa que está imaginando que está escrevendo com uma caneta e convertê-los em texto. O dispositivo converte palavras com precisão de 90 caracteres por minuto, mais do que o dobro do registro anterior para digitação com um sistema de rastreamento de cabeça3 ou olho4.
Esses rastreadores permitem que as pessoas movam o cursor do mouse e digitem mensagens lentamente, mas Jaimie Henderson, da Universidade de Stanford, na Califórnia, diz que eles consomem muito do operador. “Se você está usando o rastreamento ocular para trabalhar com um computador, então seus olhos5 estão presos ao que quer que você esteja fazendo”, diz ele. “Você não pode olhar para cima ou olhar em volta ou fazer outra coisa. Ter esse canal de entrada adicional pode ser muito importante.”
Para resolver este problema, ele e seus colegas implantaram dois pequenos conjuntos de sensores logo abaixo da superfície do cérebro2 de um homem de 65 anos que tem uma lesão6 na medula espinhal7 que o deixou paralisado abaixo do pescoço8 desde 2007. Cada conjunto de sensores foi capaz de detectar sinais1 de cerca de 100 neurônios9 – uma fração dos 100 bilhões de neurônios9 estimados no cérebro2 humano.
Enquanto o homem se imaginava escrevendo letras e palavras em um pedaço de papel, os sinais1 eram enviados a uma rede neural artificial. Krishna Shenoy, membro da equipe e também da Universidade de Stanford, diz que os sensores não têm como alvo neurônios9 exatos porque muitos milhares ou milhões podem estar envolvidos no movimento da mão10, mas com as duas matrizes monitorando cerca de 200 neurônios9, há pistas suficientes nos dados para a rede neural artificial construir um intérprete confiável de sinais1 cerebrais.
Leia sobre "Lesões11 da medula espinhal7" e "O papel dos neurotransmissores no organismo".
Frequentemente, uma rede neural é treinada com vários milhares de dados de exemplo, que neste caso seria uma gravação de um sinal12 do cérebro2 ao escrever uma determinada letra. Isso funciona bem quando grandes conjuntos de dados já existem ou são fornecidos por sistemas automatizados, mas, neste caso, gerar um arquivo tão grande não era prático porque o homem teria que pensar em escrever milhares de letras.
Em vez disso, a equipe pegou exemplos de sinais1 do cérebro2 do homem enquanto escrevia certas letras e gerou cópias adicionais com ruído aleatório adicionado para construir um conjunto de dados sintéticos.
O modelo que a equipe criou não será traduzido para outra pessoa porque a rede neural é treinada apenas em dados de um indivíduo, com sensores colocados em um local irrepetível.
O estudo descrevendo a interface criada foi publicado na revista Nature, e fornece detalhes da comunicação cérebro2-texto de alto desempenho por meio de escrita à mão10.
As interfaces cérebro2-computador (ICCs, ou BCIs em inglês [brain–computer interfaces]) podem restaurar a comunicação para pessoas que perderam a capacidade de se mover ou falar. Até agora, o foco principal da pesquisa sobre ICC tem sido a restauração das habilidades motoras grossas, como alcançar e agarrar ou digitação por meio de apontar e clicar com um cursor de computador.
No entanto, sequências rápidas de comportamentos altamente hábeis, como caligrafia ou digitação, podem permitir taxas de comunicação mais rápidas.
Nesse estudo, os pesquisadores desenvolveram uma ICC intracortical que decodifica tentativas de movimentos de escrita à mão10 da atividade neural no córtex motor e os traduz em texto em tempo real, usando uma abordagem de decodificação de rede neural recorrente.
Com esta ICC, o participante do estudo, cuja mão10 estava paralisada por lesão6 da medula espinhal7, atingiu velocidades de digitação de 90 caracteres por minuto com 94,1% de precisão bruta online e mais de 99% de precisão offline com autocorreção de uso geral.
Até onde se sabe, essas velocidades de digitação excedem as relatadas para qualquer outra ICC e são comparáveis às velocidades de digitação em smartphones típicas de indivíduos na faixa etária do participante (115 caracteres por minuto).
Finalmente, as considerações teóricas explicam por que movimentos temporalmente complexos, como caligrafia, podem ser fundamentalmente mais fáceis de decodificar do que movimentos ponto a ponto.
Esses resultados abrem uma nova abordagem para interfaces cérebro2-computador e demonstram a viabilidade de decodificar com precisão movimentos rápidos e hábeis anos após a paralisia13.
Veja também sobre "Tetraplegia: o que é" e "Neurociência - o que ela estuda".
Fontes:
Nature, publicação em 12 de maio de 2021.
New Scientist, notícia publicada em 12 de maio de 2021.