Tsinghua University e Alibaba lançam conjuntamente o OmniAvatar: modelo de pessoa digital corporal acionado por áudio impressionante

AIbase基地

Publicado emNotícias e Informações de IA · 3 minutos de leitura · Jul 2, 2025

A Universidade de Zhejiang e a Alibaba lançaram um novo modelo de áudio controlado, o OmniAvatar, marcando um novo avanço na tecnologia de personagens digitais. Esse modelo é acionado pelo áudio e pode gerar vídeos completos de personagens digitais naturais e suaves, destacando-se especialmente em cenas de canto, com sincronização precisa entre os movimentos dos lábios e o áudio, resultando em um efeito realista.

O OmniAvatar permite que os usuários controlem com precisão os detalhes da geração por meio de dicas de texto, permitindo personalizar a amplitude dos movimentos da personagem, o ambiente de fundo e as expressões emocionais, demonstrando uma alta flexibilidade. Além disso, o modelo pode gerar vídeos em que personagens virtuais interagem com objetos, oferecendo amplas possibilidades de aplicação em cenários comerciais como anúncios de e-commerce e marketing. Por exemplo, marcas podem usar o OmniAvatar para criar anúncios dinâmicos, melhorando a experiência de interação dos consumidores.

Como projeto de código aberto, o OmniAvatar foi lançado no GitHub, atraindo atenção de desenvolvedores ao redor do mundo. Sua excelente performance na geração de expressões faciais, animações de metade do corpo e do corpo inteiro supera modelos semelhantes existentes. Relata-se que o modelo também suporta aplicações em diversos cenários, incluindo programas de podcasts, interações interpessoais e apresentações dinâmicas, mostrando seu grande potencial no campo da criação de conteúdo.

Especialistas da indústria afirmam que o lançamento do OmniAvatar não apenas aumentou a autenticidade e a controlabilidade da tecnologia de personagens digitais acionados por áudio, mas também impulsionou inovações nas áreas de marketing, educação e entretenimento. No futuro, a Universidade de Zhejiang e a Alibaba continuarão aprofundando sua colaboração, explorando mais possibilidades da inteligência artificial multimodal.

OmniAvatar Universidade de Zhejiang Alibaba Tecnologia de pessoa digital

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

A equipe de IA da Xiaomi se une à Pekin para publicar um novo artigo. A jovem gênio que o Lei Xun contratou com salário alto participou da pesquisa

Xiaomi e Universidade de Pequim publicaram artigo acadêmico no arXiv. A autora Luo Fuli, nascida em 1995, formada na Universidade Normal de Pequim, atua no Instituto de Linguística Computacional da Universidade de Pequim.....

Oct 17, 2025

Hospital Tsinghua Changgong e a Beijing Electronics & Digital Intelligence colaboram no desenvolvimento do primeiro modelo de grande porte em farmacologia nacional: foco na avaliação da segurança do uso de medicamentos em grupos populacionais especiais

O Hospital Tsinghua Changgong em Pequim colaborou com a Beijing Electronics & Digital Intelligence para desenvolver o primeiro modelo de grande porte voltado exclusivamente à farmacologia no país, utilizando a inteligência artificial para otimizar os processos farmacêuticos, aumentando a eficiência e precisão na avaliação da segurança dos medicamentos para grupos populacionais específicos, como idosos, crianças e mulheres grávidas, enfrentando os desafios da rápida atualização da informação sobre medicamentos e a complexidade das diferenças individuais.

Oct 17, 2025

A criação de música com IA se torna um trabalho complementar para programadores: o single ultrapassa 2 milhões de reproduções e a receita com direitos autorais chega a vários milhares de yuans

Em 2025, as ferramentas de criação de música com IA se tornam populares, mudando o cenário da indústria. Em janeiro, um jogador de Genshin Impact usou o Suno para criar uma música com 6,4 milhões de reproduções, gerando discussões sobre a capacidade de criação com IA. Programadores se tornaram um grupo ativo, com Yapie completando uma música temática em poucas horas usando várias ferramentas em março.

Oct 17, 2025

OpenAI suspende a geração de vídeo de Martin Luther King pela Sora para proteger a imagem de figuras históricas

OpenAI suspendeu geração de retratos de Martin Luther King Jr. pelo Sora após pedido da sua herança. Empresa enfatiza equilíbrio entre liberdade de expressão e controle de imagem por figuras públicas e famílias.....

Oct 17, 2025

Equipe de Li Feifei lança RTFM: geração em tempo real do mundo 3D com uma placa H100

Equipe de Fei-Fei Li lança modelo RTFM que gera e interage com mundos 3D em tempo real em uma única GPU H100, mantendo persistência, consistência 3D e efeitos como reflexos/sombras, avançando da teoria para aplicação prática.....

Oct 17, 2025

Uma frase muda o potencial de criação da IA: estudo descobre que dicas simples podem aumentar significativamente a diversidade na saída

Um grupo de universidades, incluindo a Stanford, propôs um método chamado "amostragem linguística", que pede ao modelo para gerar 5 respostas e suas probabilidades nas dicas, aumentando efetivamente a diversidade criativa na IA generativa. Este método é aplicável tanto a modelos de linguagem quanto a imagens, estimulando uma saída criativa mais rica.

Oct 17, 2025

Chongqing reforça a regulamentação e remove mais de 10 produtos de IA irregulares para garantir a segurança da tecnologia

Chongqing combate abuso de IA, retirando 10+ produtos ilegais como 'prescrições por IA'. Tecnologia traz riscos como desinformação e segurança de dados, reforçando a necessidade de regulamentação.....

Oct 17, 2025

Diário de AI: Gemini 3.0 Pro da Google lançado em pequena escala; A Eshi Technology concluiu uma financiamento de 1 bilhão de yuans na série B+; a Baidu lançou o modelo de análise de documentos PaddleOCR-VL

O Gemini 3.0 Pro da Google começa a ser enviado em pequena escala, reforçando as capacidades de raciocínio e multimídia, e está previsto para ser oficialmente lançado até o final do mês. A equipe do DeepMind está gradualmente fornecendo atualizações aos usuários, melhorando o desempenho da IA.

Oct 17, 2025

Jornal AI: ByteDance lança modelo de grande dimensão Doubao 1.6; A Aishitech conclui uma rodada de financiamento B+ de 100 milhões de yuans; a Baidu lança o modelo de análise de documentos PaddleOCR-VL

ByteDance lança modelo Doubao 1.6, primeiro doméstico com profundidade de pensamento ajustável, otimizando eficiência e qualidade, incluindo versão leve para empresas.....

Oct 17, 2025

A empresa de vídeo AI Aishitech concluiu uma rodada de financiamento B+ de 100 milhões de yuans: ARR ultrapassa 40 milhões de dólares e tem mais de 100 milhões de usuários

Aishitech concluiu rodada B+ de 100 milhões de yuans. Receita anual recorrente supera US$40 milhões, com 100 milhões de usuários registrados e 16 milhões de MAU. Crescimento de 10x desde novembro de 2024.....

Oct 17, 2025

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Tsinghua University e Alibaba lançam conjuntamente o OmniAvatar: modelo de pessoa digital corporal acionado por áudio impressionante

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

A equipe de IA da Xiaomi se une à Pekin para publicar um novo artigo. A jovem gênio que o Lei Xun contratou com salário alto participou da pesquisa

Hospital Tsinghua Changgong e a Beijing Electronics & Digital Intelligence colaboram no desenvolvimento do primeiro modelo de grande porte em farmacologia nacional: foco na avaliação da segurança do uso de medicamentos em grupos populacionais especiais

A criação de música com IA se torna um trabalho complementar para programadores: o single ultrapassa 2 milhões de reproduções e a receita com direitos autorais chega a vários milhares de yuans

OpenAI suspende a geração de vídeo de Martin Luther King pela Sora para proteger a imagem de figuras históricas

Equipe de Li Feifei lança RTFM: geração em tempo real do mundo 3D com uma placa H100

Uma frase muda o potencial de criação da IA: estudo descobre que dicas simples podem aumentar significativamente a diversidade na saída

Chongqing reforça a regulamentação e remove mais de 10 produtos de IA irregulares para garantir a segurança da tecnologia

Diário de AI: Gemini 3.0 Pro da Google lançado em pequena escala; A Eshi Technology concluiu uma financiamento de 1 bilhão de yuans na série B+; a Baidu lançou o modelo de análise de documentos PaddleOCR-VL

Jornal AI: ByteDance lança modelo de grande dimensão Doubao 1.6; A Aishitech conclui uma rodada de financiamento B+ de 100 milhões de yuans; a Baidu lança o modelo de análise de documentos PaddleOCR-VL

A empresa de vídeo AI Aishitech concluiu uma rodada de financiamento B+ de 100 milhões de yuans: ARR ultrapassa 40 milhões de dólares e tem mais de 100 milhões de usuários

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Tsinghua University e Alibaba lançam conjuntamente o OmniAvatar: modelo de pessoa digital corporal acionado por áudio impressionante

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

A equipe de IA da Xiaomi se une à Pekin para publicar um novo artigo. A jovem gênio que o Lei Xun contratou com salário alto participou da pesquisa

Hospital Tsinghua Changgong e a Beijing Electronics & Digital Intelligence colaboram no desenvolvimento do primeiro modelo de grande porte em farmacologia nacional: foco na avaliação da segurança do uso de medicamentos em grupos populacionais especiais

A criação de música com IA se torna um trabalho complementar para programadores: o single ultrapassa 2 milhões de reproduções e a receita com direitos autorais chega a vários milhares de yuans

OpenAI suspende a geração de vídeo de Martin Luther King pela Sora para proteger a imagem de figuras históricas

Equipe de Li Feifei lança RTFM: geração em tempo real do mundo 3D com uma placa H100

Uma frase muda o potencial de criação da IA: estudo descobre que dicas simples podem aumentar significativamente a diversidade na saída

Chongqing reforça a regulamentação e remove mais de 10 produtos de IA irregulares para garantir a segurança da tecnologia

Diário de AI: Gemini 3.0 Pro da Google lançado em pequena escala; A Eshi Technology concluiu uma financiamento de 1 bilhão de yuans na série B+; a Baidu lançou o modelo de análise de documentos PaddleOCR-VL

Jornal AI: ByteDance lança modelo de grande dimensão Doubao 1.6; A Aishitech conclui uma rodada de financiamento B+ de 100 milhões de yuans; a Baidu lança o modelo de análise de documentos PaddleOCR-VL

A empresa de vídeo AI Aishitech concluiu uma rodada de financiamento B+ de 100 milhões de yuans: ARR ultrapassa 40 milhões de dólares e tem mais de 100 milhões de usuários

GEO Services