O Azure Cognitive Services - Voz é um serviço de reconhecimento e síntese de fala da Microsoft, que oferece suporte a conversão de fala em texto e texto em fala em mais de 100 idiomas e dialetos. Ele melhora a precisão da transcrição criando modelos de voz personalizados que podem lidar com termos específicos, ruídos de fundo e sotaques. Além disso, o serviço oferece suporte a recursos como transcrição em tempo real, tradução de voz e texto em fala, sendo adequado para diversos cenários comerciais, como geração de legendas, análise de gravações de chamadas e tradução de vídeos.