O dia 9 de outubro, a xAI, empresa do Elon Musk, anunciou o lançamento de seu novo modelo de geração de vídeos, o Imagine v0.9, marcando uma grande conquista para a empresa no campo da criação de IA multimodal. Em comparação com a versão anterior, v0.1, o novo modelo apresenta avanços significativos em qualidade visual, naturalidade dos movimentos e geração de áudio.
Três principais atualizações
Qualidade visual: a resolução das imagens é maior e os detalhes são mais ricos, aproximando-se do nível profissional de filmes.
Geração de movimento: os movimentos das pessoas e cenários são mais suaves e naturais, sem lacunas visíveis nas transições.
Habilidade de áudio: nova geração de áudio nativo, capaz de produzir música de fundo, diálogos e canções simultaneamente.
Geração de obras cinematográficas com um clique
O Imagine v0.9 permite uma saída completa de vídeo com “geração instantânea, sem necessidade de edição posterior”, suportando recursos como composição inteligente e controle de movimento da câmera, permitindo que criadores produzam curtos ou longos vídeos com sensação narrativa cinematográfica em alguns segundos.
Funcionalidades específicas do modelo
Sincronização de efeitos sonoros: imagem e som são alinhados frame por frame, aumentando a imersão.
Efeitos de câmera dinâmica: suporte à focalização automática e ajuste de profundidade de campo, linguagem cinematográfica.
Geração de diálogo e canto natural: os personagens podem gerar voz ou canto claro e sincronizado com emoção.
Reconhecimento de dança e ritmo: a IA consegue capturar com precisão o ritmo da música e gerar ações coordenadas.
A xAI afirma que o lançamento do Imagine v0.9 abre novos limites para a criação de vídeos com IA, permitindo que os usuários gerem rapidamente obras completas multimodais com narrativa visual, expressão sonora e senso rítmico com base em dicas de texto.