Bem-vindo ao programa "AI Diário"! Aqui é o seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os conteúdos mais recentes no campo de IA, focando nos desenvolvedores, ajudando você a compreender as tendências tecnológicas e conhecer aplicações inovadoras de produtos de IA.
Produtos de IA novos clique para saber mais:https://app.aibase.com/zh
1. Shengshu Technology lança Vidu Q2, geração de expressões sutis torna a atuação da IA mais realista!
O modelo Vidu Q2 lançado pela Shengshu Technology realizou uma grande conquista na área de geração de vídeos a partir de imagens, especialmente em termos de geração de expressões sutis, oferecendo uma experiência visual mais realista e viva para a atuação da IA.
【Resumo do AiBase:】
🎭 O Vidu Q2 consegue capturar com precisão mudanças sutis nas expressões faciais, melhorando a naturalidade e a expressão emocional dos vídeos gerados.
🎥 Suporta várias opções de modo de vídeo, incluindo geração de vídeo a partir de imagem, vídeo com quadro inicial e final, e opções ajustáveis de duração, atendendo às necessidades diversificadas.
💡 A Shengshu Technology está comprometida em impulsionar o desenvolvimento da indústria criativa por meio da tecnologia de IA, trazendo uma experiência de criação de imagem de alta qualidade para os usuários.
2. Volcano Engine lança a plataforma Lumi Lu Mi, suporte à fine-tuning de modelos visuais Lora
A plataforma Lumi Lu Mi lançada pelo Volcano Engine suporta pela primeira vez a função de fine-tuning Lora de modelos visuais como Doubao e Jiemeng, visando ajudar as empresas a personalizar estilos visuais únicos de forma eficiente, atendendo às demandas do mercado.
【Resumo do AiBase:】
🧠 A plataforma Lumi Lu Mi suporta a função de fine-tuning Lora para modelos visuais, ajudando as empresas a personalizar estilos visuais únicos.
🚀 A plataforma fornece serviços completos desde a geração de imagens até a geração de vídeos, atendendo às necessidades de AIGC das empresas em cenários profissionais.
💡 A plataforma Lumi Lu Mi ajuda as empresas a construir capacidades de produção AIGC personalizadas de forma eficiente, melhorando a experiência do usuário.
3. CTO da Alibaba Cloud revela: Tongyi Qianwen abriu 300+ modelos, downloads ultrapassam 600 milhões
A Alibaba Cloud demonstrou os notáveis avanços do projeto Tongyi Qianwen na conferência Cloud Summit 2025, incluindo mais de 300 modelos abertos e downloads que ultrapassaram 600 milhões. Isso demonstra a forte influência e força técnica da Alibaba Cloud no campo da IA e, através de modelos abertos, promove a inovação tecnológica e a aplicação prática.
【Resumo do AiBase:】
🚀 O projeto Tongyi Qianwen já abriu mais de 300 modelos, mostrando uma forte força técnica.
📊 O total de downloads ultrapassou 600 milhões, demonstrando o alto reconhecimento dos usuários sobre a tecnologia de IA da Alibaba Cloud.
🖼️ Tongyi Wanxiang gerou mais de 390 milhões de imagens e mais de 70 milhões de vídeos, destacando sua capacidade de geração de conteúdo digital.
4. Baidu lança Qianfan-VL de forma aberta,昆仑芯 apoia novas conquistas na IA multimodal
A Baidu lançou oficialmente seu novo modelo de compreensão visual Qianfan-VL, disponível nas versões de 3B, 8B e 70B, adequado para diferentes cenários. Esse modelo possui poderosas capacidades multimodais, especialmente destacando-se em OCR e educação, e sua treinamento depende da própria placa de chip昆仑芯 P800.
【Resumo do AiBase:】
🧠 O Qianfan-VL é um grande modelo multimodal poderoso capaz de processar informações de imagem e texto simultaneamente.
💡 O chip昆仑芯 P800 apoia o treinamento do modelo, com baixo consumo de energia e alta eficiência, otimizando o desempenho computacional em larga escala.
🚀 Os modelos da série Qianfan-VL foram abertos no GitHub e Hugging Face, permitindo que os desenvolvedores os utilizem livremente.
Link detalhado: https://github.com/baidubce/Qianfan-VL
5. Microsoft introduz modelos de AI da Anthropic, expandindo funções do Copilot Assistant
A Microsoft anunciou a inclusão de modelos de IA da Anthropic no Copilot Assistant, marcando um novo passo na estratégia diversificada da empresa no campo de inteligência artificial generativa. Embora a parceria com a OpenAI continue sendo próxima, a Microsoft começa a utilizar a tecnologia da Anthropic para atender às necessidades dos clientes empresariais. Os usuários corporativos agora podem usar os modelos da Anthropic para construir agentes de IA e esses modelos serão executados nas nuvens da Amazon e Google.
【Resumo do AiBase:】
🤖 A Microsoft introduziu os modelos de IA da Anthropic no Copilot Assistant, promovendo a diversificação do produto.
🔄 Embora a relação com a OpenAI ainda seja próxima, a Microsoft está gradualmente usando a tecnologia da Anthropic.
🚀 Os usuários corporativos podem escolher os modelos da Anthropic para construir agentes de IA, que devem ser habilitados por administradores antes de serem usados.
6. OpenAI constrói cinco centros de dados adicionais nos EUA, acelerando o desenvolvimento do projeto Stargate
A OpenAI anunciou que construirá cinco novos centros de dados nos Estados Unidos para aumentar a capacidade computacional do projeto Stargate. Este projeto foi lançado por várias empresas, com um investimento total de 50 bilhões de dólares, com o objetivo de impulsionar o desenvolvimento da inteligência artificial generativa.
【Resumo do AiBase:】
🌐 A OpenAI construirá cinco novos centros de dados nos Estados Unidos, e a capacidade computacional total do projeto Stargate chegará a quase 7GW.
💼 A Oracle será responsável pela construção de três novos centros de dados, e o centro de dados de Abilene será ampliado, adicionando 600MW de capacidade computacional.
🚀 A OpenAI planeja aumentar 1GW de infraestrutura de inteligência artificial por semana no futuro, para impulsionar o desenvolvimento adicional da tecnologia de IA.
7. NVIDIA abre código-fonte do modelo Audio2Face, a IA ajuda na geração de animação facial em tempo real
A NVIDIA abriu o modelo de animação facial de IA Audio2Face, fornecendo SDK e framework de treinamento, suportando processamento offline e em tempo real, adequado para jogos, cinema e outros setores. Essa tecnologia foi adotada por vários desenvolvedores de jogos, melhorando a sensação de realismo e imersão dos personagens.
【Resumo do AiBase:】
🔊 A NVIDIA abriu o modelo Audio2Face, melhorando a tecnologia de geração de animação facial de personagens virtuais.
🎮 Suporta renderização offline e processamento em streaming em tempo real, adequado para diversos cenários.
🌟 Foi adotado por vários desenvolvedores de jogos, simplificando o processo de produção e aumentando o realismo dos personagens.
Detalhes: https://build.nvidia.com/nvidia/audio2face-3d
8. Meta lança modelo de mundo de código CWM: um AI de 32B com capacidade de simulação em sandbox
O Code World Model (CWM) lançado pela Meta é um sistema de IA com 32B de parâmetros, capaz de simular e prever códigos em ambiente de sandbox, reduzindo erros e aumentando a eficiência de depuração. Esse modelo exige hardware de alta exigência, necessitando de duas GPUs H100 e tecnologia RDMA.
【Resumo do AiBase:】
🧠 O CWM realiza simulações em sandbox antes de gerar código, prevendo os resultados da execução do código.
🔍 Localiza rapidamente erros no código, melhorando a eficiência da depuração.
🚨 Alerta sobre riscos potenciais antes da execução de comandos, aumentando a segurança.
Detalhes: https://github.com/facebookresearch/cwm