Diário de IA de 30 de junho: Baidu abre o código do modelo Wenshi 4.5; Qwen VLo, modelo multimodal da Tongyi Qianwen

Bem-vindo ao canal AIbase [Diário da IA]!

Três minutos por dia para entender os principais eventos da IA do dia, ajudando você a compreender as tendências da indústria de IA e as aplicações inovadoras de produtos de IA.

Para mais informações sobre IA, acesse:https://www.aibase.com/zh

1. Baidu lança em aberto a série WENXIN Large Model 4.5, com dez novos modelos apresentados!

A Baidu lançou oficialmente a série WENXIN Large Model 4.5 e a disponibilizou completamente como código aberto, incluindo dez novos modelos com várias configurações de parâmetros, treinados e usados com o framework PaddlePaddle, com uma taxa de utilização de FLOPs de 47%, desempenho excelente em benchmarks multimodais de texto, fornecendo um guia completo e ferramentas para que os desenvolvedores ajustem e implantem facilmente, já carregado nas plataformas Hugging Face e GitHub.

Endereço de experiência: https://yiyan.baidu.com

Hugging Face: https://huggingface.co/baidu

GitHub: https://github.com/PaddlePaddle/ERNIE

2. Tongyi Qianwen lança modelo de compreensão e geração multimodal Qwen VLo

微信截图_20250628093705.png

O modelo de grande dimensão multimodal Qwen VLo foi lançado, baseado na série Qwen-VL, usando um método de geração progressiva, capaz de entender com precisão o mundo e recriá-lo com alta qualidade, suportando edição de instruções abertas, capacidade de lidar com instruções em múltiplos idiomas, entrada e saída de imagens e textos, atualmente em fase de visualização, com endereço de experiência no plataforma Qwen Chat.

Endereço de experiência: chat.qwen.ai

3. Ovis-U1 da Alibaba causa impacto: IA multimodal trinity, código aberto para impulsionar desenvolvedores globais

A equipe internacional de IA da Alibaba lançou o modelo de grande dimensão Ovis-U1 multimodal, com 300 milhões de parâmetros, integrando compreensão multimodal, geração de imagem a partir de texto e edição de imagem, com arquitetura inovadora, construída com tecnologias como Python 3.10, algoritmos de verificação de conformidade foram introduzidos durante o treinamento, pesos do modelo de código estão públicos, ajudando aplicações em diversos campos.

Projeto: (https://huggingface.co/AIDC-AI/Ovis-U1-3B)

4. Huawei abre código fonte dos modelos densos de PanGu 7B e especialistas mistos de 72B

A Huawei abre código fonte dos modelos densos PanGu 7B, modelos especialistas mistos de 72B e tecnologia de inferência Ascend, cumprindo estratégias de ecossistema Ascend, promovendo pesquisa de tecnologia de grandes modelos e aplicações industriais, os pesos e código dos modelos relacionados já estão disponíveis nos ambientes de código aberto, convidando desenvolvedores a baixá-los e dar feedback.

5. Uma imagem é suficiente para gerar vídeos de sucesso! MOKI da Meitu oferece "Anúncios Criativos de IA" gratuitamente por tempo limitado

微信截图_20250630083834.png

A Meitu lançou a função "Anúncios Criativos de IA" no MOKI, onde os usuários podem carregar imagens e escolher modelos para gerar vídeos profissionais, integrando sete modelos principais de geração de vídeo, o endereço de experiência é www.moki.cn, permitindo completar todo o processo desde a criação até o filme finalizado.

Endereço de experiência: www.moki.cn

6. API Gemini2.5Pro volta gratuita, comunidade de desenvolvedores reage calorosamente

A API Gemini2.5Pro retorna ao nível gratuito do Google AI Studio, esse modelo possui forte capacidade multimodal e raciocínio, suporta vários tipos de entrada, essa volta gratuita oferece oportunidades de inovação aos desenvolvedores, recursos computacionais gratuitos dobraram, a reação da comunidade foi positiva.

7. Função "Pesquisa Profunda" entra em teste no APP Douyin, versão web e desktop

微信截图_20250630140622.png

As plataformas Douyin iniciaram o teste da função "Pesquisa Profunda", que pode integrar informações profundas para gerar relatórios ou resultados visuais, os usuários obtêm relatórios personalizados em minutos, também suporta conversão em formato de entrevista.

8. "Caixa de Ferramentas de IA" da Xiaomi termina fase de teste, serviço interrompido a partir de 5 de julho

A fase de teste do "Caixa de Ferramentas de IA" da Xiaomi terminou, planeja suspender o serviço em 5 de julho, coletou dados e feedbacks durante o teste, não é um projeto abandonado, mas sim uma estratégia de planejamento para organização de dados, a Xiaomi continua investindo continuamente em IA, explorando e construindo uma ecosfera de IA multi-nível e mult-cenário.

9. Novo sistema de IA Open Source OmniGen2: integra imagem e geração de texto como o GPT-4o

O Instituto de Inteligência Artificial de Pequim lançou o sistema open source OmniGen2, focado em geração e edição de imagens e textos, utilizando caminhos independentes de decodificação, baseado no transformador Qwen2.5-VL-3B, usando transformadores de difusão personalizados, com mecanismo de reflexão, desempenho excepcional em vários benchmarks, será lançado na plataforma Hugging Face.

Projeto: https://huggingface.co/OmniGen2/OmniGen2

10. Zhihu "Resposta Direta" atualiza função de banco de dados, integra conteúdo da comunidade para criar experiência imersiva de perguntas e respostas de IA

A função de banco de dados da "Resposta Direta" do Zhihu foi atualizada, integrando profundamente o conteúdo da comunidade, trazendo inovações como leitura imersiva, visando oferecer experiência de perguntas e respostas de IA em múltiplos cenários, ampliar o impacto do conteúdo dos respondentes e reduzir o custo das consultas dos usuários.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services

AI Search Visibility Checker

AI Model Compatibility Checker

AI Deployment Calculator

AI Dataset Collection

Intelligent Document Recognition

Diário de IA de 30 de junho: Baidu abre o código do modelo Wenshi 4.5; Qwen VLo, modelo multimodal da Tongyi Qianwen

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

20 mil dólares para um substituto de tarefas domésticas? O robô humanoide 1X Neo, financiado pela OpenAI, começa a pré-venda e entra nas casas norte-americanas no próximo ano

Hunyuan lança o primeiro podcast de IA interativo no país, os usuários podem fazer perguntas a qualquer momento

Amazon Cloud planeja investir mais 5 bilhões de dólares na Coreia do Sul para impulsionar a construção de centrais de dados de inteligência artificial

O pai do DayZ compara seu medo atual em relação à IA com o pânico anterior em relação ao Google e à Wikipedia

Diário de IA: Douyu lança sistema automático de dublagem em grupo; Adobe Firefly Image 5 atualizado significativamente; SoulX-Podcast, modelo de voz da Soul, é lançado

Qualcomm entra no mercado de data centers! Lança os chips AI200/AI250 com objetivo de enfrentar a NVIDIA, ações subiram mais de 20% em um dia

Magic Leap anuncia parceria reatada com o Google para desenvolver protótipos de óculos AR da próxima geração

Tsinghua e Kuaishou lançam um novo modelo de difusão SVG, eficiência de treinamento aumenta 6200%

NVIDIA lança design revolucionário para centro de dados de IA, impulsionando cálculo de alto desempenho

Vice-presidente do Douyin, Li Liang, diz que a IA torna a difamação mais fácil e a plataforma está usando agentes inteligentes para combater falsas notícias

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Deployment Calculator

AI Dataset Collection

Intelligent Document Recognition

Diário de IA de 30 de junho: Baidu abre o código do modelo Wenshi 4.5; Qwen VLo, modelo multimodal da Tongyi Qianwen

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

20 mil dólares para um substituto de tarefas domésticas? O robô humanoide 1X Neo, financiado pela OpenAI, começa a pré-venda e entra nas casas norte-americanas no próximo ano

Hunyuan lança o primeiro podcast de IA interativo no país, os usuários podem fazer perguntas a qualquer momento

Amazon Cloud planeja investir mais 5 bilhões de dólares na Coreia do Sul para impulsionar a construção de centrais de dados de inteligência artificial

O pai do DayZ compara seu medo atual em relação à IA com o pânico anterior em relação ao Google e à Wikipedia

Diário de IA: Douyu lança sistema automático de dublagem em grupo; Adobe Firefly Image 5 atualizado significativamente; SoulX-Podcast, modelo de voz da Soul, é lançado

Qualcomm entra no mercado de data centers! Lança os chips AI200/AI250 com objetivo de enfrentar a NVIDIA, ações subiram mais de 20% em um dia

Magic Leap anuncia parceria reatada com o Google para desenvolver protótipos de óculos AR da próxima geração

Tsinghua e Kuaishou lançam um novo modelo de difusão SVG, eficiência de treinamento aumenta 6200%

NVIDIA lança design revolucionário para centro de dados de IA, impulsionando cálculo de alto desempenho

Vice-presidente do Douyin, Li Liang, diz que a IA torna a difamação mais fácil e a plataforma está usando agentes inteligentes para combater falsas notícias

GEO Services