A interferência ficou muito comum durante o isolamento em função da pandemia de covid-19. Qual reunião remota também não contou com a participação de “sons ambientes”, como o alerta do caminhão de gás ou os gritos das crianças? Uma equipe da Universidade de Washington, nos Estados Unidos, trabalha na criação de um fone de ouvido que poderá resolver esse problema. O dispositivo sem fio funciona em um smartphone e usa aprendizado profundo para, em tempo real, melhorar a voz do locutor e reduzir os ruídos de fundo.
Maruchi Kim, um dos criadores da solução, chamada ClearBuds, enfatiza que ela se diferencia por dois processos principais. Um deles é o uso de um conjunto de microfone duplo. “Os microfones em cada fone de ouvido criam dois fluxos de áudio sincronizados que fornecem informações e nos permitem separar espacialmente sons vindos de diferentes direções com maior resolução”, explica.
Segundo ele, a maioria dos dispositivos atuais tem microfones em cada fone de ouvido, mas apenas um fone envia áudio ativamente para um telefone por vez. “Com o ClearBuds, cada fone de ouvido envia um fluxo de áudio para o telefone ao mesmo tempo. Os pesquisadores projetaram protocolos de rede bluetooth para permitir que esses fluxos sejam sincronizados com 70 microssegundos um do outro”, detalha.
O outro ponto de destaque é que a rede neural consegue aprimorar a voz do falante com mais qualidade. Primeiro, ela suprime quaisquer ruídos que não sejam de voz. Em seguida, isola e aprimora qualquer som que esteja chegando ao mesmo tempo de ambos os fones de ouvido — ou seja, a voz do falante. “Como essa voz está próxima e aproximadamente equidistante dos dois fones de ouvido, a rede neural pode ser treinada para se concentrar apenas na fala e eliminar sons de fundo, incluindo outras vozes”, afirma Ishan Chatterjee, também criador do dispositivo.
“Na natureza”
Em testes com fones disponíveis no mercado, o ClearBuds teve um desempenho melhor, alcançando uma relação sinal/distorção mais alta. A equipe fez experimentos “na natureza”, com gravações em um café ou uma rua movimentada. Os resultados foram apresentados na última edição da Conferência Internacional da ACM sobre Sistemas, Aplicativos e Serviços Móveis, realizada em Oregon, nos EUA.
Segundo o grupo, o método é bastante parecido com o funcionamento dos ouvidos humanos. “Eles usam a diferença de tempo entre os sons que chegam aos ouvidos esquerdo e direito para determinar de qual direção o som veio”, compara Chatterjee. Uma das limitações da solução tecnológica, porém, é que é preciso usar os dois fones de ouvido para obter a experiência de supressão de ruído.
Os criadores apostam no uso do sistema de comunicação em tempo real em outras aplicações, como em alto-falantes para casas inteligentes, no rastreamento feito por robôs ou em missões de busca e resgate. No momento, a equipe trabalha para tornar os algoritmos da rede neural mais eficientes.
Fonte: Metrópoles