Recentemente, a Universidade de Hong Kong e a ByteDance lançaram oficialmente o Goku, um modelo de geração de vídeo baseado em fluxo. Este modelo utiliza algoritmos de geração avançados para criar conteúdo de vídeo de alta qualidade com base em prompts de texto, enriquecendo significativamente as formas de expressão da arte digital.
Para demonstrar a poderosa funcionalidade do modelo Goku, a equipe de pesquisa produziu uma série de exemplos de vídeo impressionantes. Esses exemplos não apenas demonstram a capacidade técnica do modelo, mas também seu potencial ilimitado em termos de criatividade.
O modelo Goku se destaca por sua velocidade de geração eficiente e qualidade de imagem. Treinado com uma grande quantidade de dados, o Goku pode gerar diversos cenários, incluindo animações, paisagens naturais e comportamentos de animais. Os pesquisadores utilizaram os prompts originais do MovieGenBench para testes, garantindo a consistência e a imparcialidade dos resultados.
Por exemplo, um vídeo mostra uma mulher elegante caminhando confiantemente pelas ruas de Tóquio. As vibrantes luzes de néon da cidade criam um cenário noturno aconchegante, com pedestres movimentados, criando uma cena vívida e realista.
Outro vídeo mostra vários mamutes gigantes caminhando tranquilamente na neve, com montanhas e florestas ao fundo, transportando o espectador para um mundo de gelo e neve. Essas cenas vibrantes não apenas capturam a atenção do público, mas também inspiram criadores de arte.
Ainda mais impressionante é que o Goku também suporta a geração direta de vídeos de humanos digitais virtuais. O Goku+ converte texto em vídeos humanos surrealistas, superando claramente os métodos existentes. Em particular, ele pode gerar vídeos com mais de 20 segundos, com movimentos de mão estáveis e expressões faciais e corporais altamente expressivas de sujeitos humanos.
Além disso, ele suporta a geração de vídeos de interação com produtos e pessoas a partir de imagens de produtos, mantendo o estilo do produto e gerando vídeos de demonstração de produtos, e pode gerar vídeos publicitários a partir de texto.
Como mostrado abaixo: O Goku+ transforma imagens de produtos em clipes de vídeo cativantes, garantindo otimização de ponta a ponta. Esse processo aumenta o apelo e a eficácia de seus materiais de marketing.
Como mostrado abaixo: Crie vídeos realistas e altamente atraentes, mostrando produtos específicos. Esses vídeos capturam efetivamente a essência do produto, aumentando o engajamento e o interesse do público.
Além disso, o modelo suporta a criação de vídeos HD personalizados a partir de texto para otimizar cenários publicitários, superando claramente os modelos básicos de vídeo da concorrência.
Acesso ao projeto: https://saiyan-world.github.io/goku/
Destaques:
🌟 O modelo Goku foi desenvolvido em parceria entre a Universidade de Hong Kong e a ByteDance, e pode gerar conteúdo de vídeo de alta qualidade a partir de prompts de texto.
🎨 O modelo apresenta diversos cenários, incluindo uma mulher elegante caminhando pelas ruas de Tóquio e mamutes gigantes caminhando na neve, com resultados vívidos e realistas.
💡 O lançamento do modelo Goku oferece uma nova ferramenta para a criação de arte visual, ajudando os criadores a explorar novas possibilidades.