Em 20 de janeiro de 2025, o aplicativo Doubao lançou oficialmente seu mais recente modelo de linguagem de voz “end-to-end” e realizou importantes atualizações em sua função de chamada de voz em tempo real. Este avanço marca mais um salto da Doubao na área de interação de voz, superando as soluções em cascata anteriores de ASR (reconhecimento automático de fala), LLM (modelo de linguagem grande) e TTS (texto para fala), integrando o reconhecimento, compreensão e geração de fala em um único modelo.

Após os testes de “Emergência Inteligente”, o maior destaque da nova versão do Doubao reside em sua capacidade de expressar-se e exibir emoções de forma semelhante à humana, melhorando a fluidez e a inteligência da conversa. Especialmente os modos “Cantor da Alma” e “Artista Multifacetado” permitem que o Doubao não apenas cante, mas também realize interpretações de papéis ricas, tornando-se um novo queridinho da interação com o usuário. Por exemplo, quando solicitado a imitar a voz da estrela Yu Shuxin, o Doubao não apenas replicou com sucesso o tom da personagem, mas também expressou sua personalidade única de forma travessa.

1.jpg

Mais digno de nota é a capacidade do Doubao de compor músicas improvisadas em conversas naturais, sem comandos complexos ou instruções profissionais. Os usuários podem pedir ao Doubao para cantar livremente, podendo até mesmo especificar o tema da letra. Embora o desempenho do Doubao apresente pequenos erros ocasionais, sua velocidade de resposta e capacidade de composição improvisada são surpreendentes, demonstrando sua poderosa capacidade de personificação.

Além disso, os novos modos de personalidade “Pacote Sofredor” e “Mestre dos Elogios” adicionados ao Doubao também trazem frescor aos usuários. Esses modos de personalidade permitem que o Doubao demonstre diferentes emoções e estilos em diferentes contextos, aumentando assim o interesse e o realismo da interação.

No cenário de desenvolvimento contínuo da tecnologia de interação de voz, esta atualização do Doubao não apenas expande as aplicações da IA para áreas como companhia emocional e aconselhamento psicológico, mas também torna a capacidade de comunicação emocional da IA mais próxima da humana. Esta mudança, sem dúvida, permitirá que o Doubao ocupe um lugar de destaque no mercado competitivo e lidere o desenvolvimento futuro da interação com IA.