A empresa líder global em tecnologia de voz por IA, ElevenLabs, lançou oficialmente sua mais recente modelo de texto para voz Eleven v3 (versão Alfa), que é considerado o modelo de IA de voz mais expressivo até hoje. Este avanço revolucionário não apenas melhorou a naturalidade da síntese de voz e a capacidade de expressar emoções, mas também forneceu ferramentas mais poderosas para criadores de conteúdo e desenvolvedores, ajudando na criação de vídeos, álbuns de áudio e ferramentas multimídia.

image.png

Inovações tecnológicas: diálogos mais naturais e expressões emocionais

O Eleven v3 introduz uma nova arquitetura que permite entender mais profundamente o significado do texto, melhorando significativamente a expressividade da voz. Em comparação com versões anteriores, o v3 suporta mais de 70 idiomas e pode lidar com cenas de diálogos com múltiplos personagens, simulando variações de tom, flutuações emocionais e até interrupções características de conversas reais. Com a nova função de tags de áudio, os usuários podem usar etiquetas como [triste], [bravo], [sussurros] ou [risos] para controlar com precisão a expressão emocional da voz e as respostas não verbais, como risos ou suspiros. Esse controle granular oferece aos criadores uma flexibilidade sem precedentes, especialmente útil para dublagem de filmes, produção de álbuns de áudio e design de voz para jogos.

Aplicações: capacitando criadores e desenvolvedores

A ElevenLabs enfatiza que o modelo v3 foi projetado especificamente para criadores de conteúdo e desenvolvedores de ferramentas de mídia. Seja para criar narrações envolventes para vídeos, livros de áudio emocionantes ou desenvolver ferramentas de mídia interativa, o alto desempenho do v3 pode melhorar significativamente a experiência do usuário. Além disso, o modelo suporta a identificação e distinção de até 32 falantes diferentes, oferecendo suporte robusto para cenas de diálogos com múltiplos participantes. Isso torna o v3 promissor em aplicações educacionais, de entretenimento e em aplicativos empresariais, como centrais de atendimento ao cliente baseadas em IA.

Beta público e promoções: uma bênção para desenvolvedores e criadores

O Eleven v3 já está em fase beta público e oferece um desconto de 80% durante o mês de junho, incentivando os usuários a experimentarem suas poderosas funcionalidades. A ElevenLabs anunciou também que o API público estará disponível em breve, e os desenvolvedores podem obter acesso antecipado entrando em contato com a equipe de vendas. Para cenários de tempo real e conversação, a ElevenLabs recomenda temporariamente continuar usando os modelos v2.5Turbo ou Flash, pois a versão em tempo real do v3 também está em desenvolvimento e deve expandir ainda mais seu escopo de aplicação.

Influência no setor: liderando a nova onda de IA de voz

Com o rápido avanço da tecnologia de voz por IA, o lançamento do ElevenLabs v3 sem dúvida intensificou a competitividade no setor. Anteriormente, a ElevenLabs já havia conquistado importância no campo de álbuns de áudio, dublagem e assistentes de IA por sua alta precisão em clonagem de voz e conversão de texto para voz. O lançamento do v3 consolidou ainda mais sua vantagem competitiva, especialmente em comparação com modelos como o OpenAI Whisper v3 e Google Gemini2.0, onde o v3 se destaca particularmente em suporte a múltiplos idiomas e expressão emocional. Usuários da plataforma X já chamaram o v3 de "o melhor modelo de texto para voz já existente", o que reflete bem sua influência.

A ElevenLabs declarou que o v3 é apenas um passo em sua rota tecnológica, e continuará otimizando o desempenho do modelo, lançando versões com baixa latência para aplicações em tempo real e expandindo ainda mais o suporte a idiomas e adequação de cenários. A AIbase acredita que o lançamento do v3 não apenas marca uma quebra de tecnologia pela ElevenLabs no campo da voz por IA, mas também abre novas possibilidades para a criação de conteúdo e interação humano-máquina. Com a popularização da tecnologia, a voz por IA tem o potencial de se tornar o principal motor de criação de conteúdo digital.

A AIbase continuará acompanhando as últimas inovações da ElevenLabs e da tecnologia de voz por IA, trazendo-lhe as notícias mais recentes.