A área de vídeos com inteligência artificial está passando por uma inovação significativa: o modelo de vídeo Vidu Q1 da Shengshu Technology lançou oficialmente a função de referência, oferecendo uma experiência revolucionária de "de ideia para geração de material de vídeo em um único passo", redefinindo assim os limites tecnológicos e a eficiência na criação de conteúdo.

Na produção tradicional de vídeos, os criadores precisam passar por uma série de etapas complexas, como escrever roteiros, projetar personagens, desenhar storyboard, filmagem no local real e edição pós-produção. A criação de um curto-metragem normalmente leva semanas ou até meses. Com a introdução da função de referência do Vidu Q1, este modelo rompe completamente esse padrão. Os usuários só precisam carregar imagens de personagens, objetos e cenários, e o sistema pode gerar rapidamente materiais de vídeo que integram diversos elementos, permitindo a "geração sem storyboard". Por exemplo, ao fornecer duas imagens de personagens westerns, duas imagens de cenários e duas imagens de revólveres, é possível gerar diretamente uma cena cinematográfica de confronto western, com paisagens distantes, close-ups e avanço da narrativa de forma contínua, sem necessidade de qualquer design de storyboard manual.

Screenshot do WeChat_20250708173704.png

Essa inovação não apenas simplifica o processo de criação, mas também oferece aos criadores uma flexibilidade sem precedentes. A biblioteca de materiais carregada funciona como um "elenco virtual", permitindo que os usuários combinem livremente personagens, cenários e objetos, mudando elementos individuais para trocas suaves na narrativa das cenas. Por exemplo, o mesmo personagem western pode estar correndo na pradaria no primeiro momento, e no seguinte já sentado no bar recebendo um copo de bebida da moça, com a narrativa naturalmente avançando e as relações entre os personagens se desenvolvendo progressivamente.

No aspecto comercial, a função de referência do Vidu Q1 demonstra uma grande adaptabilidade. Para atender às exigências rigorosas de consistência dos principais elementos nas áreas de comércio eletrônico, publicidade e desenvolvimento de IP, essa função permite a entrada de até 7 principais elementos simultaneamente, garantindo alta consistência em cenários como interação entre múltiplos personagens e apresentação de produtos. Por exemplo, uma marca pode fazer "Anne Hathaway" anunciar diferentes produtos, desde um Tesla rosa até uma bebida da Mochi Ice Cream, mantendo os detalhes dos produtos exatamente reproduzidos, e o custo de um vídeo de 5 segundos em 1080P é apenas 0,90 yuans, equivalente a 1/30 do custo de materiais de direitos autorais tradicionais. Se for gerado um episódio de 48 minutos de série de televisão, o custo será cerca de mil yuans, sendo muito mais econômico do que materiais de direitos autorais personalizados.

No nível técnico, o Vidu Q1 apresenta melhorias abrangentes em qualidade de imagem, movimento da câmera e estilo de animação: suporta saída de imagem em alta definição de 1080P, com detalhes comparáveis à produção cinematográfica; a função de movimento de quadro inicial e final requer apenas duas imagens para gerar linguagem cinematográfica de mestre; o estilo de animação torna-se mais diversificado, com uma expressão dinâmica significativamente melhorada; foi adicionada uma função de efeitos sonoros inteligentes, que pode gerar efeitos sonoros exclusivos com um toque e suporta sobreposição de múltiplos efeitos sonoros, cobrindo todo o processo profissional de criação.