Bem-vindo ao canal AIbase [Diário da IA]!

Três minutos por dia para entender os principais eventos da IA do dia, ajudando você a compreender as tendências da indústria de IA e as aplicações inovadoras de produtos de IA.

Para mais informações sobre IA, acesse:https://www.aibase.com/zh

1. Baidu lança em aberto a série WENXIN Large Model 4.5, com dez novos modelos apresentados!

image.png

A Baidu lançou oficialmente a série WENXIN Large Model 4.5 e a disponibilizou completamente como código aberto, incluindo dez novos modelos com várias configurações de parâmetros, treinados e usados com o framework PaddlePaddle, com uma taxa de utilização de FLOPs de 47%, desempenho excelente em benchmarks multimodais de texto, fornecendo um guia completo e ferramentas para que os desenvolvedores ajustem e implantem facilmente, já carregado nas plataformas Hugging Face e GitHub.

Endereço de experiência: https://yiyan.baidu.com

 Hugging Face: https://huggingface.co/baidu

GitHub: https://github.com/PaddlePaddle/ERNIE

2. Tongyi Qianwen lança modelo de compreensão e geração multimodal Qwen VLo

微信截图_20250628093705.png

O modelo de grande dimensão multimodal Qwen VLo foi lançado, baseado na série Qwen-VL, usando um método de geração progressiva, capaz de entender com precisão o mundo e recriá-lo com alta qualidade, suportando edição de instruções abertas, capacidade de lidar com instruções em múltiplos idiomas, entrada e saída de imagens e textos, atualmente em fase de visualização, com endereço de experiência no plataforma Qwen Chat.

Endereço de experiência: chat.qwen.ai

3. Ovis-U1 da Alibaba causa impacto: IA multimodal trinity, código aberto para impulsionar desenvolvedores globais

image.png

A equipe internacional de IA da Alibaba lançou o modelo de grande dimensão Ovis-U1 multimodal, com 300 milhões de parâmetros, integrando compreensão multimodal, geração de imagem a partir de texto e edição de imagem, com arquitetura inovadora, construída com tecnologias como Python 3.10, algoritmos de verificação de conformidade foram introduzidos durante o treinamento, pesos do modelo de código estão públicos, ajudando aplicações em diversos campos.

Projeto: (https://huggingface.co/AIDC-AI/Ovis-U1-3B)

4. Huawei abre código fonte dos modelos densos de PanGu 7B e especialistas mistos de 72B

A Huawei abre código fonte dos modelos densos PanGu 7B, modelos especialistas mistos de 72B e tecnologia de inferência Ascend, cumprindo estratégias de ecossistema Ascend, promovendo pesquisa de tecnologia de grandes modelos e aplicações industriais, os pesos e código dos modelos relacionados já estão disponíveis nos ambientes de código aberto, convidando desenvolvedores a baixá-los e dar feedback.

5. Uma imagem é suficiente para gerar vídeos de sucesso! MOKI da Meitu oferece "Anúncios Criativos de IA" gratuitamente por tempo limitado

微信截图_20250630083834.png

A Meitu lançou a função "Anúncios Criativos de IA" no MOKI, onde os usuários podem carregar imagens e escolher modelos para gerar vídeos profissionais, integrando sete modelos principais de geração de vídeo, o endereço de experiência é www.moki.cn, permitindo completar todo o processo desde a criação até o filme finalizado.

Endereço de experiência: www.moki.cn

6. API Gemini2.5Pro volta gratuita, comunidade de desenvolvedores reage calorosamente

QQ20250630-104007.png

A API Gemini2.5Pro retorna ao nível gratuito do Google AI Studio, esse modelo possui forte capacidade multimodal e raciocínio, suporta vários tipos de entrada, essa volta gratuita oferece oportunidades de inovação aos desenvolvedores, recursos computacionais gratuitos dobraram, a reação da comunidade foi positiva.

7. Função "Pesquisa Profunda" entra em teste no APP Douyin, versão web e desktop

微信截图_20250630140622.png

As plataformas Douyin iniciaram o teste da função "Pesquisa Profunda", que pode integrar informações profundas para gerar relatórios ou resultados visuais, os usuários obtêm relatórios personalizados em minutos, também suporta conversão em formato de entrevista.

8. "Caixa de Ferramentas de IA" da Xiaomi termina fase de teste, serviço interrompido a partir de 5 de julho

006Q2YfWgy1i2x8ss8nr1j314016sjxl.jpg

A fase de teste do "Caixa de Ferramentas de IA" da Xiaomi terminou, planeja suspender o serviço em 5 de julho, coletou dados e feedbacks durante o teste, não é um projeto abandonado, mas sim uma estratégia de planejamento para organização de dados, a Xiaomi continua investindo continuamente em IA, explorando e construindo uma ecosfera de IA multi-nível e mult-cenário.

9. Novo sistema de IA Open Source OmniGen2: integra imagem e geração de texto como o GPT-4o

image.png

O Instituto de Inteligência Artificial de Pequim lançou o sistema open source OmniGen2, focado em geração e edição de imagens e textos, utilizando caminhos independentes de decodificação, baseado no transformador Qwen2.5-VL-3B, usando transformadores de difusão personalizados, com mecanismo de reflexão, desempenho excepcional em vários benchmarks, será lançado na plataforma Hugging Face.

Projeto: https://huggingface.co/OmniGen2/OmniGen2

10. Zhihu "Resposta Direta" atualiza função de banco de dados, integra conteúdo da comunidade para criar experiência imersiva de perguntas e respostas de IA

A função de banco de dados da "Resposta Direta" do Zhihu foi atualizada, integrando profundamente o conteúdo da comunidade, trazendo inovações como leitura imersiva, visando oferecer experiência de perguntas e respostas de IA em múltiplos cenários, ampliar o impacto do conteúdo dos respondentes e reduzir o custo das consultas dos usuários.