Bem-vindo ao quadro de notícias da IA! Aqui é o seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos as principais notícias do setor da IA, focando no desenvolvimento de tecnologia e inovação para ajudá-lo a entender as tendências técnicas e produtos aplicativos de IA.

Produtos de IA frescos:Clique para saber mais:https://top.aibase.com/

1. AliCloud WanXiang Wan2.1-VACE é aberto ao público - chamado de primeiro modelo unificado de edição de vídeo de código aberto

O WanXiang anunciou o VACE como open source, suportando várias resoluções e tarefas, proporcionando uma experiência completa de criação de vídeo com um mecanismo de entrada multimodal que permite edição de vídeo eficiente e flexível.

image.png

[Resumo AiBase:]

✨ Suporta tarefas como geração de vídeo a partir de texto, geração de imagem referencial, edição local e extensão de vídeo, aumentando a eficiência criativa.

🌟 Capacidade poderosa de reedição controlada, baseada em postura corporal humana, fluxo de movimento e controle de geração, suportando referências de assunto e fundo.

🔧 Propõe a unidade condicional de vídeo VCU, integrando entradas multimodais, permitindo combinações livres de tarefas e edições flexíveis.

Link detalhado: https://github.com/Wan-Video/Wan2.1

2. OpenAI atualiza o ChatGPT: introduz oficialmente a GPT-4.1 com capacidades de codificação extremamente potentes

A OpenAI lançou a GPT-4.1 e sua versão leve, GPT-4.1 mini, significativamente melhorando as capacidades de codificação e a experiência de execução de instruções, enquanto otimizava a experiência do usuário e o suporte multimodal, consolidando ainda mais sua liderança no campo da IA.

image.png

[Resumo AiBase:]

🚀 A GPT-4.1 possui poderosas capacidades de codificação, sendo mais eficiente na execução de demandas de programação complexas, com velocidade de execução mais rápida, ideal para desenvolvedores e cenários de processamento de instruções.

🌐 A GPT-4.1 mini é leve e eficiente, ainda funcionando bem em dispositivos com recursos limitados, oferecendo ampla acessibilidade para usuários gratuitos e pagantes.

🌟 O ChatGPT adicionou várias novas funcionalidades, como cópia com long press, cópia de tabelas e transmissão em fluxo, com melhorias significativas na experiência do usuário.

3. Stability AI libera modelo de texto para áudio de 341M extremamente leve, pode rodar localmente no celular, gerando áudio em apenas 8 segundos!

A Stability AI lançou um modelo de texto para áudio denominado 'Gerador rápido de áudio pós-treinamento acelerado por adversário', com apenas 341 milhões de parâmetros, capaz de gerar 12 segundos de áudio em 75 milissegundos em GPUs H100 e realizar a mesma tarefa em CPUs de celular em 7 segundos, com desempenho impressionante e diversidade forte.

image.png

[Resumo AiBase:]

⚡️ O método ARC de pós-treinamento não é baseado em distilação, melhorando a velocidade e qualidade de geração do modelo.

📱 Projeto leve, suporta execução local no celular, melhorando significativamente a experiência de aplicativos criativos móveis.

💫 Função de transferência de estilo de áudio, inspirando mais ideias criativas.

Link detalhado: https://arxiv.org/pdf/2505.08175

4. Poe relata: modelos de vídeo gerados por models como Lingling ocupam aproximadamente 30% das quotas, liderando Runway

O relatório de tendências de uso de modelos de IA de primavera de 2025 revelou que os modelos de geração de vídeos de várias séries de Lingling da Kuaishou se destacaram no campo de geração de vídeos a partir de texto, ocupando 30% do mercado. O modelo Lingling 2.0 alcançou 21% das proporções de uso em apenas três semanas desde seu lançamento. Desde junho do ano passado, o número total de usuários globais ultrapassou 22 milhões, com aumento de 25 vezes no número de usuários ativos mensais, resultando em um crescimento significativo na quantidade de vídeos e imagens gerados.

image.png

[Resumo AiBase:]

🌟 Os modelos grandes de Lingling ocupam 30% do mercado no campo de geração de vídeos a partir de texto, liderando concorrentes como Runway.

📈 O modelo Lingling 2.0 conquistou 21% do mercado de geração de vídeos em apenas três semanas após seu lançamento em abril.

👥 O usuário global da Lingling AI ultrapassou 22 milhões, com um aumento de 25 vezes no número de usuários ativos mensais, gerando vídeos e imagens significativamente mais numerosos.

5. A equipe de inteligência artificial da Microsoft WizardLM entra para o time da Tencent, possivelmente incorporada ao sistema de pesquisa de modelos grandes da Hunchuan

A equipe de inteligência artificial da Microsoft, WizardLM, entrou para o time da "Hunchuan" da Tencent, marcando o esforço adicional da Tencent no campo de modelos grandes. Essa equipe não só trouxe várias quebras tecnológicas, mas também demonstrou sua força com modelos de código aberto.

image.png

[Resumo AiBase:]

✨ A equipe anteriormente ligada à Microsoft, WizardLM, integrou-se completamente ao time da Hunchuan da Tencent, fortalecendo a competitividade da Tencent no campo de modelos grandes.

🚀 O modelo Hunyuan-TurboS0416 foi o primeiro a usar o nome "Hunchuan", simbolizando a fusão profunda da equipe com a Tencent.

💼 A Tencent planeja aumentar significativamente seus investimentos em IA, visando assumir uma posição mais dominante na competição global de IA.

6. A Tencent anunciou que o Hunchuan Image 2.0 será lançado em 16 de maio

O time de pesquisa de grandes modelos Hunchuan da Tencent anunciou que o Hunchuan Image 2.0 será lançado em 16 de maio, marcando um importante avanço da Tencent no campo da visão artificial, com o conceito central de 'mais inteligente, mais aberto, mais chinês'.

image.png

[Resumo AiBase:]

🌟 O Hunchuan Image 2.0 será lançado em 16 de maio, marcando outro avanço importante da Tencent no campo da visão artificial.

🌐 A nova ferramenta enfatiza 'mais inteligente, mais aberto, mais chinês', ajudando criadores e empresas a entrar em uma nova era de produção visual impulsionada pela IA.

🚀 Após a atualização do modelo Hunchuan no ano passado, a Tencent demonstra novamente sua capacidade de inovação contínua no campo da inteligência artificial.

7. Xangai inicia a Aliança Ecológica de Identificação de IA, com Xiaohongshu e MiniMax entre os primeiros membros

Este artigo apresenta a Aliança Ecológica de Identificação de IA de Xangai, que visa promover o desenvolvimento da tecnologia de identificação em IA, aumentar a transparência e segurança do conteúdo gerado, e estabelecer uma base confiável para o ambiente de IA através de interpretação de políticas e cooperação empresarial.

image.png

[Resumo AiBase:]

🌟 A aliança, orientada pelo Escritório de Redes do Comitê Municipal de Xangai, reúne empresas importantes, com o objetivo de aumentar a transparência e segurança do conteúdo gerado por IA.

🔍 O Centro Nacional de Emergência da Internet e o Instituto de Padrões Eletrônicos da China interpretam políticas relacionadas, enfatizando a combinação de regras internacionais e características chinesas.

🤝 Empresas como Xiaohongshu e MiniMax participam do trabalho de identificação, explorando soluções de identificação para vários tipos de conteúdo e acumulando experiências de governança.

8. Lightricks lança modelo refinado LTX-Video-13B! Geração de vídeo de alta definição em 10 segundos, velocidade e qualidade em duplo salto!

A empresa israelense Lightricks lançou o modelo aberto de geração de vídeo AI LTX-Video-13B refinado, com base em 13 bilhões de parâmetros, combinado com técnicas de renderização multi-escala e otimização eficiente de quantização, aumentando a velocidade de geração de vídeo para menos de 10 segundos, mantendo saída de alta qualidade.

image.png

[Resumo AiBase:]

🚀 Usa técnicas de renderização multi-escala, gerando vídeos de alta definição em 10 segundos, uma melhoria de mais de cinco vezes na velocidade.

🌍 Modelo aberto, suporta execução em dispositivos com baixa memória gráfica, reduzindo os custos de produção de vídeos por IA.

🌟 A velocidade de geração aumenta 30 vezes, rivalizando com obras cinematográficas profissionais, remodelando o ecossistema de criação de conteúdo.

Link detalhado: https://github.com/Lightricks/LTX-Video

9. Google AlphaEvolve lançado! Gemini Auto-Evolving AI resolve problemas matemáticos, otimiza chips e centrais de dados, aumentando a eficiência de treinamento em 32,5%

O AlphaEvolve da DeepMind da Google, que combina o modelo grande de linguagem Gemini com algoritmos de evolução, mostrou capacidades poderosas de autootimização em diversos campos, incluindo agendamento de centrais de dados, design de chips, treinamento de IA e pesquisa matemática.

image.png

[Resumo AiBase:]

🌟 Gemini combinado com algoritmos de evolução, resolvendo problemas complexos como otimização de chips e problemas matemáticos.

🚀 O AlphaEvolve otimiza o agendamento de centrais de dados, recuperando 0,7% do poder global de computação, economizando custos operacionais.

🔍 Aumenta a eficiência de treinamento de IA, com a velocidade de treinamento do modelo Gemini aumentando em 32,5%, demonstrando fortes capacidades de autootimização.

10. O plug-in do navegador Yuanbao da Tencent está disponível na versão de prova no Chrome

O plug-in do navegador Yuanbao da Tencent está disponível na versão de prova no Chrome, oferecendo funções como bola flutuante, barra lateral fixa e barra de ferramentas de seleção de texto, melhorando a eficiência da navegação da web e o processamento de informações.

image.png

[Resumo AiBase:]

✨ A função da bola flutuante permite traduzir e resumir conteúdo de páginas web com um clique, superando facilmente barreiras linguísticas e economizando tempo de leitura.

💬 A barra lateral permanente pode responder perguntas de forma eficiente, suportando perguntas com capturas de tela, aumentando significativamente a eficiência de obtenção de informações.

🔍 A barra de ferramentas de seleção de texto realiza buscas ou traduções instantâneas após selecionar o texto, tornando o processamento de informações mais fluido.

Link detalhado: https://yuanbao.tencent.com/download