Bem-vindo ao programa "AI Daily"! Aqui é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias, apresentamos os conteúdos mais recentes no campo de IA, focando nos desenvolvedores, ajudando você a compreender as tendências tecnológicas e conhecer aplicações inovadoras de produtos de IA.

Novos produtos de IA clicar para mais informações:https://app.aibase.com/zh

1. Alibaba Cloud lança o primeiro modelo de IA multimodal completo do mundo, Qwen3-Omni, capaz de processar texto, imagens, áudio e vídeo de forma unificada

A Alibaba Cloud lançou o Qwen3-Omni, o primeiro modelo de IA multimodal completo nativo do mundo, que suporta o processamento unificado de texto, imagens, áudio e vídeo. O modelo demonstra desempenho avançado em várias áreas e está aberto ao público, atendendo às necessidades multilíngues dos usuários globais.

image.png

【Resumo da AiBase:】

🌟 O Qwen3-Omni é o primeiro modelo de IA multimodal completo do mundo, capaz de processar texto, imagens, áudio e vídeo de forma unificada.

🌐 O modelo suporta 119 idiomas de texto e 19 tipos de entrada de voz, atendendo às necessidades multilíngues dos usuários globais.

🖼️ O novo Qwen-Image-Edit-2509 suporta edição múltipla de imagens, melhorando significativamente a consistência e o efeito da edição.

Link detalhado: https://github.com/QwenLM/Qwen3-Omni huggingface: https://huggingface.co/collections/Qwen/qwen3-omni-68d100a86cd0906843ceccbe

2. Acabe com os problemas de edição de imagem! A Alibaba Qwen-Image oferece uma função de edição múltipla de imagem para criar filmes publicitários profissionais com um clique

O artigo apresenta uma grande atualização na funcionalidade da ferramenta de edição de imagem da IA da Alibaba, incluindo a nova função de edição múltipla de imagem, a introdução da tecnologia de mapa de pontos-chave do ControlNet e a expansão das aplicações para a criação de memes, fornecendo soluções mais eficientes para os setores de comércio eletrônico e marketing digital.

image.png

【Resumo da AiBase:】

🖼️ Nova função de edição múltipla de imagem, suportando combinações flexíveis de pessoa + pessoa, pessoa + produto e pessoa + cenário.

⚙️ Introduz a função de mapa de pontos-chave do ControlNet, aumentando a precisão do controle da postura humana.

🛒 Expande as aplicações, suportando a criação de memes, auxiliando os setores de comércio eletrônico e marketing.

Link detalhado: https://chat.qwen.ai/?inputFeature=image_edit

3. Baidu lança o modelo Qianfan-VL, modelos em diferentes tamanhos atendem a diferentes cenários

O time de inteligência artificial da Baidu Cloud lançou um novo modelo de compreensão visual chamado Qianfan-VL, que inclui três tamanhos: 3B, 8B e 70B, otimizado profundamente para aplicações multimodais empresariais. O Qianfan-VL se destaca em OCR, cenas educacionais e resolução de matemática, mostrando capacidade geral excelente e desempenho superior em tarefas específicas nos testes padrão.

image.png

【Resumo da AiBase:】

🧠 Modelos em diferentes tamanhos atendem a diferentes cenários.

📊 Os modelos de 8B e 70B possuem capacidade de raciocínio e pensamento.

📄 Desempenho excepcional em OCR e compreensão de documentos.

Link detalhado: https://baidubce.github.io/Qianfan-VL/

4. Google lança o protocolo AP2, colaborando com PayPal para iniciar uma nova era de pagamentos com IA

O protocolo AP2 da Google fornece um framework seguro e confiável para pagamentos com IA, garantindo a legalidade e segurança das transações por meio de mecanismos de token de autorização, enquanto colabora com o PayPal para impulsionar a inovação e aplicação da IA no setor de pagamentos.

image.png

【Resumo da AiBase:】

🛒 O protocolo AP2 fornece um mecanismo de autorização seguro para pagamentos com IA, garantindo a legalidade das transações.

🤝 A Google colabora com o PayPal para impulsionar a aplicação prática da IA no setor de pagamentos.

🔒 O sistema de tokens de autorização define claramente as responsabilidades, aumentando a transparência das transações.

Link detalhado: https://github.com/google-agentic-commerce/AP2

5. Apple expande sua plataforma de geração de imagens: Image Playground irá introduzir mais modelos de IA de terceiros

A Apple realizou uma atualização significativa no Image Playground nas versões macOS Tahoe26, iPadOS26 e iOS26, introduzindo o ChatGPT como modelo de geração de imagens e planejando suportar mais modelos de terceiros, como o Gemini2.5Flash Image da Google.

image.png

【Resumo da AiBase:】

🍎 A Apple expandiu o Image Playground para suportar mais modelos de IA de terceiros, incluindo o OpenAI e o Gemini2.5Flash Image da Google.

⚙️ Novo indicador "estimativa de atraso" e "identificador de marca", indicando que a Apple está otimizando o mecanismo de seleção de modelos.

🔒 A Apple pode preferir parcerias com parceiros externos, em vez de apoiar diretamente modelos de código aberto, para garantir a segurança das ferramentas de geração de imagens.

6. Transforme-se em uma máquina de estudo em um clique! O Baidu Search lança o AI Companion

O Baidu lançou o AI Companion, transformando celulares comuns em máquinas de estudo por meio de tecnologia de IA, fornecendo funções como exercícios precisos e treinamento de fala para estudantes, ajudando a promover a equidade educacional e a difusão de recursos.

image.png

【Resumo da AiBase:】

📚 O AI Companion do Baidu transforma celulares comuns em máquinas de estudo por meio de tecnologia de IA, melhorando a equidade educacional.

🗣️ Oferece ferramentas como fala AI e correção de ensaios, ajudando os alunos a aprender de forma personalizada.

🌍 A equipe de educação do Baidu usa tecnologias como Wenshin 4.5 para promover a integração e difusão de recursos educacionais.

7. Assistente de Tabela AI do DingTalk lançado oficialmente: uma frase gera uma tabela, construindo uma plataforma de aplicativos empresariais de IA

O DingTalk lançou o Assistente de Tabela AI, transformando a Tabela AI em uma plataforma de criação de aplicativos voltada para a era da IA. Os usuários precisam apenas atualizar para a versão mais recente para experimentar essa nova função. O Assistente de Tabela AI suporta descrições de ideias em linguagem natural, geração automática de tabelas, fluxos de trabalho automatizados e painéis de análise de dados, reduzindo significativamente a barreira de uso.

image.png

【Resumo da AiBase:】

✨ O Assistente de Tabela AI suporta descrições de ideias em linguagem natural, gerando automaticamente tabelas, fluxos de trabalho automatizados e painéis de análise de dados.

🚀 Introduziu o agente de campo, adicionou 30 agentes e suporta capacidades de IA multimodal, como compreensão de vídeo e personagens digitais.

🌐 Suporte a fluxos de trabalho entre plataformas, adicionou suporte a fluxos de trabalho de plataformas como BaiLian e Coze, permitindo a coleta e análise de dados entre plataformas.

8. DeepSeek-V3.1-Terminus é lançado com destaque: desempenho totalmente aprimorado, capacidade de raciocínio profundo significativamente fortalecida

A DeepSeek lançou o modelo DeepSeek-V3.1-Terminus e o tornou aberto ao público. O modelo corrigiu problemas de inconsistência linguística e caracteres anormais em relação à versão anterior, otimizou o desempenho de agentes de programação e busca. Os resultados de testes básicos mostram que o desempenho foi melhorado em 0,2% a 36,5%, especialmente destacando-se em conhecimento de alto nível, multimodalidade e raciocínio profundo.

image.png

【Resumo da AiBase:】

🧠 O modelo DeepSeek-V3.1-Terminus tem desempenho totalmente aprimorado, com aumento de 0,2% a 36,5%

🚀 Otimizou especialmente o desempenho de agentes de programação e busca, corrigindo problemas de inconsistência linguística da versão anterior.

🔍 Excelente desempenho no teste HLE, demonstrando forte capacidade de raciocínio profundo e processamento multimodal.

Link detalhado: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus

9. O serviço de assinatura Kimi Agent chega com surpresas! Doação se torna 9 meses de VIP, 49 yuan para pesquisa profunda em IA

A Kimi lançou um novo serviço de assinatura de Agent, oferecendo benefícios adicionais aos usuários antigos que fizeram doações, enquanto o sistema de assinatura baseado em nomes de batidas musicais demonstrou criatividade da marca. A função de pesquisa profunda baseia-se em modelos próprios, fornecendo insights profissionais e impulsionando a evolução dos assistentes de IA para agentes inteligentes.

image.png

【Resumo da AiBase:】

✨ A Kimi lançou o serviço de assinatura Agent, os usuários que fizeram doações recebem tempo adicional de assinatura.

🎵 O sistema de assinatura é nomeado com termos de batidas de música clássica, combinando arte e tecnologia.

🔍 A função de pesquisa profunda baseia-se em modelos próprios, fornecendo análises multidimensionais e descobertas cognitivas.

10. O primeiro modelo global de inteligência corporal universal é aberto ao público! O GO-1 da Zhiyuan Robot choca o mercado

A Zhiyuan Robot anunciou que o modelo base de inteligência corporal universal GO-1 está totalmente aberto ao público, sendo o primeiro modelo de inteligência corporal com arquitetura ViLLA no mundo, capaz de compreender e executar tarefas complexas. Essa medida promoverá a aplicação e pesquisa da inteligência corporal, reduzirá a barreira tecnológica e atrairá mais desenvolvedores para participar dessa ecossistema, estimulando inovação e cooperação interdisciplinar.

image.png

【Resumo da AiBase:】

🤖 O GO-1 é o primeiro modelo de inteligência corporal com arquitetura ViLLA no mundo, combinando capacidade visual, linguística e ação potencial.

💡 A abertura do GO-1 promoverá a aplicação e pesquisa da inteligência corporal, reduzindo a barreira tecnológica.

🌐 A Zhiyuan Robot deseja atrair mais desenvolvedores para participar do ecossistema de inteligência corporal, estimulando inovação e cooperação interdisciplinar.