Gostou do artigo? Compartilhe!

Aprendizado profundo restaura a inteligibilidade da fala na interferência de vários locutores para usuários de implante coclear

A+ A- Alterar tamanho da letra
Avalie esta notícia

Novo estudo, publicado na revista Scientific Reports, revela o potencial da inteligência artificial em revolucionar a experiência auditiva de usuários de implantes cocleares. Pesquisadores utilizaram algoritmos avançados de aprendizado profundo (deep learning), como a Rede Neural Recorrente (RNN) e o SepFormer, para melhorar drasticamente a inteligibilidade da fala em ambientes ruidosos e com várias pessoas falando ao mesmo tempo, como é o caso em festas, reuniões e outros eventos sociais.

Os resultados dos testes com treze usuários de implantes cocleares são impressionantes: os algoritmos conseguiram filtrar ruídos complexos e aprimorar substancialmente a clareza da fala, mesmo em situações desafiadoras. Essa descoberta abre caminho para transformar a qualidade de vida de inúmeras pessoas que dependem de implantes cocleares, oferecendo uma solução eficaz para um desafio de longa data.

Leia sobre "Deficiência auditiva", "Surdez: como é" e "Implante1 coclear ou ouvido biônico".

No artigo publicado, os pesquisadores relatam que os implantes cocleares (IC) não oferecem o mesmo nível de eficácia em ambientes ruidosos e silenciosos. Os algoritmos atuais de redução de ruído de microfone único em aparelhos auditivos e ICs apenas removem ruídos estacionários previsíveis e são ineficazes contra ruídos realistas e não estacionários, como interferência de vários locutores.

Desenvolvimentos recentes em algoritmos de redes neurais profundas (RNP) alcançaram um desempenho notável no aprimoramento e separação da fala, especialmente na remoção do ruído da fala. No entanto, mais trabalhos são necessários para investigar o potencial dos algoritmos de RNP na remoção de ruídos de fala quando testados com ouvintes equipados com ICs.

Neste estudo, implementou-se dois algoritmos de RNP que são adequados para aplicações em processamento de áudio de fala: (1) rede neural recorrente (RNN) e (2) SepFormer. Os algoritmos foram treinados com um conjunto de dados customizado (∼ 30 h), e então testados com treze ouvintes com IC.

Os algoritmos RNN e SepFormer melhoraram significativamente a inteligibilidade da fala para o ouvinte com IC no ruído, sem comprometer a qualidade percebida da fala em geral. Esses algoritmos não apenas aumentaram a inteligibilidade no ruído estacionário não relacionado à fala, mas também introduziram uma melhoria substancial no ruído não estacionário, onde as estratégias convencionais de processamento de sinal2 são insuficientes e trazem poucos benefícios.

Esses resultados mostram a promessa do uso de algoritmos de RNP como uma solução para desafios de escuta na interferência de ruído de vários locutores.

 

Fonte: Scientific Reports, publicação em 09 de junho de 2024.

 

NEWS.MED.BR, 2024. Aprendizado profundo restaura a inteligibilidade da fala na interferência de vários locutores para usuários de implante coclear. Disponível em: <https://www.news.med.br/p/medical-journal/1470417/aprendizado-profundo-restaura-a-inteligibilidade-da-fala-na-interferencia-de-varios-locutores-para-usuarios-de-implante-coclear.htm>. Acesso em: 26 abr. 2025.

Complementos

1 Implante: 1. Em cirurgia e odontologia é o material retirado do próprio indivíduo, de outrem ou artificialmente elaborado que é inserido ou enxertado em uma estrutura orgânica, de modo a fazer parte integrante dela. 2. Na medicina, é qualquer material natural ou artificial inserido ou enxertado no organismo. 3. Em patologia, é uma célula ou fragmento de tecido, especialmente de tumores, que migra para outro local do organismo, com subsequente crescimento.
2 Sinal: 1. É uma alteração percebida ou medida por outra pessoa, geralmente um profissional de saúde, sem o relato ou comunicação do paciente. Por exemplo, uma ferida. 2. Som ou gesto que indica algo, indício. 3. Dinheiro que se dá para garantir um contrato.
Gostou do artigo? Compartilhe!