Modelo de vídeo Goku, desenvolvido pela ByteDance e pela Universidade de Hong Kong, gera vídeos de avatares digitais

AIbase基地

Publicado emNotícias e Informações de IA · 6 minutos de leitura · Feb 11, 2025

3.3k

Recentemente, a Universidade de Hong Kong e a ByteDance lançaram oficialmente o Goku, um modelo de geração de vídeo baseado em fluxo. Este modelo utiliza algoritmos de geração avançados para criar conteúdo de vídeo de alta qualidade com base em prompts de texto, enriquecendo significativamente as formas de expressão da arte digital.

Para demonstrar a poderosa funcionalidade do modelo Goku, a equipe de pesquisa produziu uma série de exemplos de vídeo impressionantes. Esses exemplos não apenas demonstram a capacidade técnica do modelo, mas também seu potencial ilimitado em termos de criatividade.

O modelo Goku se destaca por sua velocidade de geração eficiente e qualidade de imagem. Treinado com uma grande quantidade de dados, o Goku pode gerar diversos cenários, incluindo animações, paisagens naturais e comportamentos de animais. Os pesquisadores utilizaram os prompts originais do MovieGenBench para testes, garantindo a consistência e a imparcialidade dos resultados.

Por exemplo, um vídeo mostra uma mulher elegante caminhando confiantemente pelas ruas de Tóquio. As vibrantes luzes de néon da cidade criam um cenário noturno aconchegante, com pedestres movimentados, criando uma cena vívida e realista.

Outro vídeo mostra vários mamutes gigantes caminhando tranquilamente na neve, com montanhas e florestas ao fundo, transportando o espectador para um mundo de gelo e neve. Essas cenas vibrantes não apenas capturam a atenção do público, mas também inspiram criadores de arte.

Ainda mais impressionante é que o Goku também suporta a geração direta de vídeos de humanos digitais virtuais. O Goku+ converte texto em vídeos humanos surrealistas, superando claramente os métodos existentes. Em particular, ele pode gerar vídeos com mais de 20 segundos, com movimentos de mão estáveis e expressões faciais e corporais altamente expressivas de sujeitos humanos.

Além disso, ele suporta a geração de vídeos de interação com produtos e pessoas a partir de imagens de produtos, mantendo o estilo do produto e gerando vídeos de demonstração de produtos, e pode gerar vídeos publicitários a partir de texto.

Como mostrado abaixo: O Goku+ transforma imagens de produtos em clipes de vídeo cativantes, garantindo otimização de ponta a ponta. Esse processo aumenta o apelo e a eficácia de seus materiais de marketing.

Como mostrado abaixo: Crie vídeos realistas e altamente atraentes, mostrando produtos específicos. Esses vídeos capturam efetivamente a essência do produto, aumentando o engajamento e o interesse do público.

Além disso, o modelo suporta a criação de vídeos HD personalizados a partir de texto para otimizar cenários publicitários, superando claramente os modelos básicos de vídeo da concorrência.

Acesso ao projeto: https://saiyan-world.github.io/goku/

Destaques:
🌟 O modelo Goku foi desenvolvido em parceria entre a Universidade de Hong Kong e a ByteDance, e pode gerar conteúdo de vídeo de alta qualidade a partir de prompts de texto.
🎨 O modelo apresenta diversos cenários, incluindo uma mulher elegante caminhando pelas ruas de Tóquio e mamutes gigantes caminhando na neve, com resultados vívidos e realistas.
💡 O lançamento do modelo Goku oferece uma nova ferramenta para a criação de arte visual, ajudando os criadores a explorar novas possibilidades.

Goku ByteDance Modelo de geração de vídeo Arte digital

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

20 mil dólares para um substituto de tarefas domésticas? O robô humanoide 1X Neo, financiado pela OpenAI, começa a pré-venda e entra nas casas norte-americanas no próximo ano

A empresa norueguesa de robôs 1X lança o primeiro robô humanoide para uso doméstico, o Neo, com preço de 20 mil dólares e taxa de assinatura mensal de 499 dólares. Este robô de 1,68 metros foi projetado especialmente para tarefas domésticas como lavar pratos e organizar, utilizando um modelo de inteligência artificial combinada com suporte remoto humano, necessitando de apoio externo para completar tarefas complexas.

Oct 29, 2025

300

Hunyuan lança o primeiro podcast de IA interativo no país, os usuários podem fazer perguntas a qualquer momento

Tencent Hunyuan lançou o primeiro podcast interativo com IA da China, permitindo que os usuários façam perguntas em tempo real por voz ou texto aos apresentadores e convidados, superando as limitações unidirecionais dos podcasts tradicionais e melhorando a interatividade e eficiência na obtenção de informações.....

Oct 29, 2025

130

Amazon Cloud planeja investir mais 5 bilhões de dólares na Coreia do Sul para impulsionar a construção de centrais de dados de inteligência artificial

A AWS da Amazon anunciou que planeja investir mais 5 bilhões de dólares na Coreia do Sul nos próximos seis anos para expandir centrais de dados de inteligência artificial, colaborando com o Grupo SK para construir uma grande instalação em Ulsan. O investimento total na Coreia chegará a 12,6 bilhões de dólares, destacando a importância estratégica do mercado sul-coreano.

Oct 29, 2025

Diário de IA: Douyu lança sistema automático de dublagem em grupo; Adobe Firefly Image 5 atualizado significativamente; SoulX-Podcast, modelo de voz da Soul, é lançado

Sistema de áudio AI da Doubao gera dramas com múltiplos narradores diretamente de textos, precisão de 98% na identificação de personagens, revolucionando produção de conteúdo sonoro.....

Oct 29, 2025

120

Qualcomm entra no mercado de data centers! Lança os chips AI200/AI250 com objetivo de enfrentar a NVIDIA, ações subiram mais de 20% em um dia

A Qualcomm lançou dois chips de inferência de IA em nuvem, o AI200 e o AI250, que devem ser comercializados em 2026 e 2027, marcando uma transição da fabricação de chips para terminais para uma infraestrutura completa de IA. A notícia impulsionou o aumento das ações em mais de 20% em um único dia, sendo o maior aumento desde 2019. Diferente da abordagem abrangente da NVIDIA, a Qualcomm está focada no mercado de inferência de grandes modelos, destacando vantagens em eficiência energética e custo.

Oct 29, 2025

Magic Leap anuncia parceria reatada com o Google para desenvolver protótipos de óculos AR da próxima geração

Em 29 de outubro, a Magic Leap e o Google anunciaram uma nova parceria na conferência de investimento no futuro de Riad, para desenvolver protótipos de óculos de realidade aumentada, promovendo o avanço da tecnologia de realidade aumentada. Ross Rosenburg, líder da Magic Leap, disse que a empresa está se transformando de pioneira em realidade aumentada para parceira de ecossistema, utilizando sua experiência em inovações em óptica e exibição para alcançar uma nova fase de sua visão.

Oct 29, 2025

Tsinghua e Kuaishou lançam um novo modelo de difusão SVG, eficiência de treinamento aumenta 6200%

A Universidade de Tsinghua e a equipe Kuaishou Ke Ling lançaram o modelo SVG, substituindo o VAE, resolvendo o problema de entrelaçamento semântico, aumentando a eficiência de treinamento em 6200%, velocidade de geração aumenta em 3500%, marcando o início do fim do VAE na área de geração de imagens.

Oct 29, 2025

110

NVIDIA lança design revolucionário para centro de dados de IA, impulsionando cálculo de alto desempenho

Na conferência GTC 2025, a NVIDIA apresentou o projeto "Omniverse DSX Blueprint", um design especialmente desenvolvido para centros de dados de IA com capacidade de giga瓦, conhecido como "Fábrica de IA". Este projeto baseia-se no framework Omniverse e suporta diferentes escalas, desde 1 bilhão até 10 bilhões de watts, com o objetivo de treinar e executar eficientemente grandes modelos de IA, atendendo à crescente demanda por computação de IA, sendo uma importante evolução na infraestrutura de inteligência artificial.

Oct 29, 2025

110

Vice-presidente do Douyin, Li Liang, diz que a IA torna a difamação mais fácil e a plataforma está usando agentes inteligentes para combater falsas notícias

O vice-presidente do Douyin, Li Liang, enfatizou que a IA pode ser facilmente usada para criar notícias falsas, e a plataforma está ativamente utilizando tecnologia de IA para combater difamações, desenvolvendo um 'agente de combate às falsas notícias'. Busca rápida em toda a rede é uma das prioridades este ano.

Oct 29, 2025

140

Revolução dos podcasts com IA! Doubao lança sistema automático de voz múltipla 98% de precisão na identificação de personagens, rivalizando com dramas de rádio profissionais

A equipe de voz do Doubao lançou uma solução para "podcasts de IA com múltiplas vozes", realizando a produção totalmente automática desde o texto de um romance até o produto final de drama de rádio. Não é necessário dublagem, edição ou intervenção humana, reduzindo custos e aumentando a eficiência, com resultados próximos aos padrões profissionais, atingindo uma taxa de identificação de personagens de 98%.

Oct 29, 2025

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Brand Visibility

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

Modelo de vídeo Goku, desenvolvido pela ByteDance e pela Universidade de Hong Kong, gera vídeos de avatares digitais

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

20 mil dólares para um substituto de tarefas domésticas? O robô humanoide 1X Neo, financiado pela OpenAI, começa a pré-venda e entra nas casas norte-americanas no próximo ano

Hunyuan lança o primeiro podcast de IA interativo no país, os usuários podem fazer perguntas a qualquer momento

Amazon Cloud planeja investir mais 5 bilhões de dólares na Coreia do Sul para impulsionar a construção de centrais de dados de inteligência artificial

Diário de IA: Douyu lança sistema automático de dublagem em grupo; Adobe Firefly Image 5 atualizado significativamente; SoulX-Podcast, modelo de voz da Soul, é lançado

Qualcomm entra no mercado de data centers! Lança os chips AI200/AI250 com objetivo de enfrentar a NVIDIA, ações subiram mais de 20% em um dia

Magic Leap anuncia parceria reatada com o Google para desenvolver protótipos de óculos AR da próxima geração

Tsinghua e Kuaishou lançam um novo modelo de difusão SVG, eficiência de treinamento aumenta 6200%

NVIDIA lança design revolucionário para centro de dados de IA, impulsionando cálculo de alto desempenho

Vice-presidente do Douyin, Li Liang, diz que a IA torna a difamação mais fácil e a plataforma está usando agentes inteligentes para combater falsas notícias

Revolução dos podcasts com IA! Doubao lança sistema automático de voz múltipla 98% de precisão na identificação de personagens, rivalizando com dramas de rádio profissionais

Notícias de IA Relacionadas Recomendadas

20 mil dólares para um substituto de tarefas domésticas? O robô humanoide 1X Neo, financiado pela OpenAI, começa a pré-venda e entra nas casas norte-americanas no próximo ano

Hunyuan lança o primeiro podcast de IA interativo no país, os usuários podem fazer perguntas a qualquer momento

Amazon Cloud planeja investir mais 5 bilhões de dólares na Coreia do Sul para impulsionar a construção de centrais de dados de inteligência artificial

Diário de IA: Douyu lança sistema automático de dublagem em grupo; Adobe Firefly Image 5 atualizado significativamente; SoulX-Podcast, modelo de voz da Soul, é lançado

Qualcomm entra no mercado de data centers! Lança os chips AI200/AI250 com objetivo de enfrentar a NVIDIA, ações subiram mais de 20% em um dia

Magic Leap anuncia parceria reatada com o Google para desenvolver protótipos de óculos AR da próxima geração

Tsinghua e Kuaishou lançam um novo modelo de difusão SVG, eficiência de treinamento aumenta 6200%

NVIDIA lança design revolucionário para centro de dados de IA, impulsionando cálculo de alto desempenho

Vice-presidente do Douyin, Li Liang, diz que a IA torna a difamação mais fácil e a plataforma está usando agentes inteligentes para combater falsas notícias

Revolução dos podcasts com IA! Doubao lança sistema automático de voz múltipla 98% de precisão na identificação de personagens, rivalizando com dramas de rádio profissionais

GEO Services