Jornal AI: Alibaba lança modelo multimodal Qwen3-Omni; Google lança protocolo AP2; Baidu lança modelo Qianfan-VL

Bem-vindo ao programa "AI Daily"! Aqui é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias, apresentamos os conteúdos mais recentes no campo de IA, focando nos desenvolvedores, ajudando você a compreender as tendências tecnológicas e conhecer aplicações inovadoras de produtos de IA.

Novos produtos de IA clicar para mais informações:https://app.aibase.com/zh

1. Alibaba Cloud lança o primeiro modelo de IA multimodal completo do mundo, Qwen3-Omni, capaz de processar texto, imagens, áudio e vídeo de forma unificada

A Alibaba Cloud lançou o Qwen3-Omni, o primeiro modelo de IA multimodal completo nativo do mundo, que suporta o processamento unificado de texto, imagens, áudio e vídeo. O modelo demonstra desempenho avançado em várias áreas e está aberto ao público, atendendo às necessidades multilíngues dos usuários globais.

【Resumo da AiBase:】
🌟 O Qwen3-Omni é o primeiro modelo de IA multimodal completo do mundo, capaz de processar texto, imagens, áudio e vídeo de forma unificada.
🌐 O modelo suporta 119 idiomas de texto e 19 tipos de entrada de voz, atendendo às necessidades multilíngues dos usuários globais.
🖼️ O novo Qwen-Image-Edit-2509 suporta edição múltipla de imagens, melhorando significativamente a consistência e o efeito da edição.
Link detalhado: https://github.com/QwenLM/Qwen3-Omni huggingface: https://huggingface.co/collections/Qwen/qwen3-omni-68d100a86cd0906843ceccbe

2. Acabe com os problemas de edição de imagem! A Alibaba Qwen-Image oferece uma função de edição múltipla de imagem para criar filmes publicitários profissionais com um clique

O artigo apresenta uma grande atualização na funcionalidade da ferramenta de edição de imagem da IA da Alibaba, incluindo a nova função de edição múltipla de imagem, a introdução da tecnologia de mapa de pontos-chave do ControlNet e a expansão das aplicações para a criação de memes, fornecendo soluções mais eficientes para os setores de comércio eletrônico e marketing digital.

【Resumo da AiBase:】
🖼️ Nova função de edição múltipla de imagem, suportando combinações flexíveis de pessoa + pessoa, pessoa + produto e pessoa + cenário.
⚙️ Introduz a função de mapa de pontos-chave do ControlNet, aumentando a precisão do controle da postura humana.
🛒 Expande as aplicações, suportando a criação de memes, auxiliando os setores de comércio eletrônico e marketing.
Link detalhado: https://chat.qwen.ai/?inputFeature=image_edit

3. Baidu lança o modelo Qianfan-VL, modelos em diferentes tamanhos atendem a diferentes cenários

O time de inteligência artificial da Baidu Cloud lançou um novo modelo de compreensão visual chamado Qianfan-VL, que inclui três tamanhos: 3B, 8B e 70B, otimizado profundamente para aplicações multimodais empresariais. O Qianfan-VL se destaca em OCR, cenas educacionais e resolução de matemática, mostrando capacidade geral excelente e desempenho superior em tarefas específicas nos testes padrão.

【Resumo da AiBase:】
🧠 Modelos em diferentes tamanhos atendem a diferentes cenários.
📊 Os modelos de 8B e 70B possuem capacidade de raciocínio e pensamento.
📄 Desempenho excepcional em OCR e compreensão de documentos.
Link detalhado: https://baidubce.github.io/Qianfan-VL/

4. Google lança o protocolo AP2, colaborando com PayPal para iniciar uma nova era de pagamentos com IA

O protocolo AP2 da Google fornece um framework seguro e confiável para pagamentos com IA, garantindo a legalidade e segurança das transações por meio de mecanismos de token de autorização, enquanto colabora com o PayPal para impulsionar a inovação e aplicação da IA no setor de pagamentos.

【Resumo da AiBase:】
🛒 O protocolo AP2 fornece um mecanismo de autorização seguro para pagamentos com IA, garantindo a legalidade das transações.
🤝 A Google colabora com o PayPal para impulsionar a aplicação prática da IA no setor de pagamentos.
🔒 O sistema de tokens de autorização define claramente as responsabilidades, aumentando a transparência das transações.
Link detalhado: https://github.com/google-agentic-commerce/AP2

5. Apple expande sua plataforma de geração de imagens: Image Playground irá introduzir mais modelos de IA de terceiros

A Apple realizou uma atualização significativa no Image Playground nas versões macOS Tahoe26, iPadOS26 e iOS26, introduzindo o ChatGPT como modelo de geração de imagens e planejando suportar mais modelos de terceiros, como o Gemini2.5Flash Image da Google.

【Resumo da AiBase:】
🍎 A Apple expandiu o Image Playground para suportar mais modelos de IA de terceiros, incluindo o OpenAI e o Gemini2.5Flash Image da Google.
⚙️ Novo indicador "estimativa de atraso" e "identificador de marca", indicando que a Apple está otimizando o mecanismo de seleção de modelos.
🔒 A Apple pode preferir parcerias com parceiros externos, em vez de apoiar diretamente modelos de código aberto, para garantir a segurança das ferramentas de geração de imagens.

6. Transforme-se em uma máquina de estudo em um clique! O Baidu Search lança o AI Companion

O Baidu lançou o AI Companion, transformando celulares comuns em máquinas de estudo por meio de tecnologia de IA, fornecendo funções como exercícios precisos e treinamento de fala para estudantes, ajudando a promover a equidade educacional e a difusão de recursos.

【Resumo da AiBase:】
📚 O AI Companion do Baidu transforma celulares comuns em máquinas de estudo por meio de tecnologia de IA, melhorando a equidade educacional.
🗣️ Oferece ferramentas como fala AI e correção de ensaios, ajudando os alunos a aprender de forma personalizada.
🌍 A equipe de educação do Baidu usa tecnologias como Wenshin 4.5 para promover a integração e difusão de recursos educacionais.

7. Assistente de Tabela AI do DingTalk lançado oficialmente: uma frase gera uma tabela, construindo uma plataforma de aplicativos empresariais de IA

O DingTalk lançou o Assistente de Tabela AI, transformando a Tabela AI em uma plataforma de criação de aplicativos voltada para a era da IA. Os usuários precisam apenas atualizar para a versão mais recente para experimentar essa nova função. O Assistente de Tabela AI suporta descrições de ideias em linguagem natural, geração automática de tabelas, fluxos de trabalho automatizados e painéis de análise de dados, reduzindo significativamente a barreira de uso.

【Resumo da AiBase:】
✨ O Assistente de Tabela AI suporta descrições de ideias em linguagem natural, gerando automaticamente tabelas, fluxos de trabalho automatizados e painéis de análise de dados.
🚀 Introduziu o agente de campo, adicionou 30 agentes e suporta capacidades de IA multimodal, como compreensão de vídeo e personagens digitais.
🌐 Suporte a fluxos de trabalho entre plataformas, adicionou suporte a fluxos de trabalho de plataformas como BaiLian e Coze, permitindo a coleta e análise de dados entre plataformas.

8. DeepSeek-V3.1-Terminus é lançado com destaque: desempenho totalmente aprimorado, capacidade de raciocínio profundo significativamente fortalecida

A DeepSeek lançou o modelo DeepSeek-V3.1-Terminus e o tornou aberto ao público. O modelo corrigiu problemas de inconsistência linguística e caracteres anormais em relação à versão anterior, otimizou o desempenho de agentes de programação e busca. Os resultados de testes básicos mostram que o desempenho foi melhorado em 0,2% a 36,5%, especialmente destacando-se em conhecimento de alto nível, multimodalidade e raciocínio profundo.

【Resumo da AiBase:】
🧠 O modelo DeepSeek-V3.1-Terminus tem desempenho totalmente aprimorado, com aumento de 0,2% a 36,5%
🚀 Otimizou especialmente o desempenho de agentes de programação e busca, corrigindo problemas de inconsistência linguística da versão anterior.
🔍 Excelente desempenho no teste HLE, demonstrando forte capacidade de raciocínio profundo e processamento multimodal.
Link detalhado: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus

9. O serviço de assinatura Kimi Agent chega com surpresas! Doação se torna 9 meses de VIP, 49 yuan para pesquisa profunda em IA

A Kimi lançou um novo serviço de assinatura de Agent, oferecendo benefícios adicionais aos usuários antigos que fizeram doações, enquanto o sistema de assinatura baseado em nomes de batidas musicais demonstrou criatividade da marca. A função de pesquisa profunda baseia-se em modelos próprios, fornecendo insights profissionais e impulsionando a evolução dos assistentes de IA para agentes inteligentes.

【Resumo da AiBase:】
✨ A Kimi lançou o serviço de assinatura Agent, os usuários que fizeram doações recebem tempo adicional de assinatura.
🎵 O sistema de assinatura é nomeado com termos de batidas de música clássica, combinando arte e tecnologia.
🔍 A função de pesquisa profunda baseia-se em modelos próprios, fornecendo análises multidimensionais e descobertas cognitivas.

10. O primeiro modelo global de inteligência corporal universal é aberto ao público! O GO-1 da Zhiyuan Robot choca o mercado

A Zhiyuan Robot anunciou que o modelo base de inteligência corporal universal GO-1 está totalmente aberto ao público, sendo o primeiro modelo de inteligência corporal com arquitetura ViLLA no mundo, capaz de compreender e executar tarefas complexas. Essa medida promoverá a aplicação e pesquisa da inteligência corporal, reduzirá a barreira tecnológica e atrairá mais desenvolvedores para participar dessa ecossistema, estimulando inovação e cooperação interdisciplinar.

【Resumo da AiBase:】
🤖 O GO-1 é o primeiro modelo de inteligência corporal com arquitetura ViLLA no mundo, combinando capacidade visual, linguística e ação potencial.
💡 A abertura do GO-1 promoverá a aplicação e pesquisa da inteligência corporal, reduzindo a barreira tecnológica.
🌐 A Zhiyuan Robot deseja atrair mais desenvolvedores para participar do ecossistema de inteligência corporal, estimulando inovação e cooperação interdisciplinar.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Brand Visibility

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

Jornal AI: Alibaba lança modelo multimodal Qwen3-Omni; Google lança protocolo AP2; Baidu lança modelo Qianfan-VL

站长之家

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

Capital Venture Investe em Rogo Technologies, Ferramenta de IA Pode Revolucionar o Papel do Bancário Júnior

Empresa de Direito e Impostos Steuerrecht.com aumenta a eficiência com o ChatGPT Business

Modelo M2 da MiniMax de código aberto: IA de alto desempenho que capacita a codificação e o agente, custando apenas 8% do concorrente

Diferença de 99,7% nos custos! A IA imita o estilo de escritores e é mais apreciada, apontando para os limites do uso razoável e desencadeando litígios de direitos autorais

SoftBank investe 22,5 bilhões de dólares para apoiar o OpenAI, música AI e plano de financiamento super acelerado

Gere uma imagem em uma frase! A Microsoft Photos lança função de desenho por IA e redefinição inteligente

Lidando com deficiências na inferência do modelo: a equipe MIND da Apple acelera a contratação de profissionais de IA

Diário de IA: OpenAI lança navegador Atlas; Qwen3-VL da Tongyi adiciona dois tamanhos de modelo, 2B e 32B; Baidu lança modelo de grande dimensão de reforço de evidências em ciclo

Qwen3-VL da Alibaba agora com dois tamanhos de modelo, 2B e 32B, que podem ser executados facilmente no celular

O Qwen3-VL da Tongyi Qianwen lança novos modelos de 2B e 32B! A matriz de código aberto é totalmente atualizada