Aprendizado profundo restaura a inteligibilidade da fala na interferência de vários locutores para usuários de implante coclear
Novo estudo, publicado na revista Scientific Reports, revela o potencial da inteligência artificial em revolucionar a experiência auditiva de usuários de implantes cocleares. Pesquisadores utilizaram algoritmos avançados de aprendizado profundo (deep learning), como a Rede Neural Recorrente (RNN) e o SepFormer, para melhorar drasticamente a inteligibilidade da fala em ambientes ruidosos e com várias pessoas falando ao mesmo tempo, como é o caso em festas, reuniões e outros eventos sociais.
Os resultados dos testes com treze usuários de implantes cocleares são impressionantes: os algoritmos conseguiram filtrar ruídos complexos e aprimorar substancialmente a clareza da fala, mesmo em situações desafiadoras. Essa descoberta abre caminho para transformar a qualidade de vida de inúmeras pessoas que dependem de implantes cocleares, oferecendo uma solução eficaz para um desafio de longa data.
Leia sobre "Deficiência auditiva", "Surdez: como é" e "Implante1 coclear ou ouvido biônico".
No artigo publicado, os pesquisadores relatam que os implantes cocleares (IC) não oferecem o mesmo nível de eficácia em ambientes ruidosos e silenciosos. Os algoritmos atuais de redução de ruído de microfone único em aparelhos auditivos e ICs apenas removem ruídos estacionários previsíveis e são ineficazes contra ruídos realistas e não estacionários, como interferência de vários locutores.
Desenvolvimentos recentes em algoritmos de redes neurais profundas (RNP) alcançaram um desempenho notável no aprimoramento e separação da fala, especialmente na remoção do ruído da fala. No entanto, mais trabalhos são necessários para investigar o potencial dos algoritmos de RNP na remoção de ruídos de fala quando testados com ouvintes equipados com ICs.
Neste estudo, implementou-se dois algoritmos de RNP que são adequados para aplicações em processamento de áudio de fala: (1) rede neural recorrente (RNN) e (2) SepFormer. Os algoritmos foram treinados com um conjunto de dados customizado (∼ 30 h), e então testados com treze ouvintes com IC.
Os algoritmos RNN e SepFormer melhoraram significativamente a inteligibilidade da fala para o ouvinte com IC no ruído, sem comprometer a qualidade percebida da fala em geral. Esses algoritmos não apenas aumentaram a inteligibilidade no ruído estacionário não relacionado à fala, mas também introduziram uma melhoria substancial no ruído não estacionário, onde as estratégias convencionais de processamento de sinal2 são insuficientes e trazem poucos benefícios.
Esses resultados mostram a promessa do uso de algoritmos de RNP como uma solução para desafios de escuta na interferência de ruído de vários locutores.
Fonte: Scientific Reports, publicação em 09 de junho de 2024.