O dia 9 de outubro, a xAI, empresa do Elon Musk, anunciou o lançamento de seu novo modelo de geração de vídeos, o Imagine v0.9, marcando uma grande conquista para a empresa no campo da criação de IA multimodal. Em comparação com a versão anterior, v0.1, o novo modelo apresenta avanços significativos em qualidade visual, naturalidade dos movimentos e geração de áudio.

 Três principais atualizações

  • Qualidade visual: a resolução das imagens é maior e os detalhes são mais ricos, aproximando-se do nível profissional de filmes.

  • Geração de movimento: os movimentos das pessoas e cenários são mais suaves e naturais, sem lacunas visíveis nas transições.

  • Habilidade de áudio: nova geração de áudio nativo, capaz de produzir música de fundo, diálogos e canções simultaneamente.

 Geração de obras cinematográficas com um clique

O Imagine v0.9 permite uma saída completa de vídeo com “geração instantânea, sem necessidade de edição posterior”, suportando recursos como composição inteligente e controle de movimento da câmera, permitindo que criadores produzam curtos ou longos vídeos com sensação narrativa cinematográfica em alguns segundos.

Funcionalidades específicas do modelo

  • Sincronização de efeitos sonoros: imagem e som são alinhados frame por frame, aumentando a imersão.

  • Efeitos de câmera dinâmica: suporte à focalização automática e ajuste de profundidade de campo, linguagem cinematográfica.

  • Geração de diálogo e canto natural: os personagens podem gerar voz ou canto claro e sincronizado com emoção.

  • Reconhecimento de dança e ritmo: a IA consegue capturar com precisão o ritmo da música e gerar ações coordenadas.

A xAI afirma que o lançamento do Imagine v0.9 abre novos limites para a criação de vídeos com IA, permitindo que os usuários gerem rapidamente obras completas multimodais com narrativa visual, expressão sonora e senso rítmico com base em dicas de texto.