A Microsoft anunciou hoje novos recursos para o Teams que usam inteligência artificial para aperfeiçoar chamadas de vídeo. Os recursos vão melhorar coisas como acústica ruim em uma sala, e quando duas pessoas falam ao mesmo tempo e a voz de uma é cortada, fazendo com que a pessoa tenha que se repetir.
Outro recurso vai abordar o problema de ecos em chamadas. “Fazemos o melhor possível com o processamento de sinal digital no Teams, mas agora começamos a usar aprendizado de máquina para criar cancelamento de eco, onde você pode reduzir o eco de todos os dispositivos conectados”, explicou Robert Aichner, gerente do programa de conversação inteligente e nuvem da Microsoft, ao The Verge.
Veja como as melhorias funcionam no vídeo abaixo.
Para treinar seus modelos, a Microsoft usou 30.000 horas de fala e capturou o som de milhares de dispositivos através de um programa de crowdsourcing. No programa, usuários do Teams são pagos para gravar sua voz e reproduzir o áudio de seu dispositivo.
“Também simulamos cerca de 100.000 salas diferentes… a acústica da sala desempenha um papel importante no cancelamento de eco”, diz Aichner. Se o Teams detecta que o som está reverberando em uma sala, resultando em áudio raso, o modelo consegue converter o áudio capturado para parecer que os participantes do Teams estão falando em um microfone de curto alcance.
Outra mudança interessante é a capacidade de interromper outra pessoa nas chamadas do Teams sem que sua voz seja cortada. Os novos recursos chegam na esteira de melhorias feitas anteriormente com supressão de ruído baseado em IA. E todo esse processamento é feito localmente nos dispositivos clientes, não em uma nuvem.
“O processamento é local porque fazer todas as chamadas serem processadas na nuvem seria muito caro… e obviamente teríamos que repassar esse custo para os clientes”, explicou Aichner.
Esses novos recursos de melhoria de som já estão disponíveis para clientes pagantes do Teams. Segundo a Microsoft, isso significa que 90% dos dispositivos que usam o app de videochamadas têm acesso a eles.
Via The Verge
Fonte: Olhar Digital
Comentários