Bem-vindo ao programa "AI Daily"! Aqui é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias, apresentamos os conteúdos mais recentes no campo de IA, focando nos desenvolvedores, ajudando você a compreender as tendências tecnológicas e conhecer aplicações inovadoras de produtos de IA.
Novos produtos de IA clicar para mais informações:https://app.aibase.com/zh
1. Alibaba Cloud lança o primeiro modelo de IA multimodal completo do mundo, Qwen3-Omni, capaz de processar texto, imagens, áudio e vídeo de forma unificada
A Alibaba Cloud lançou o Qwen3-Omni, o primeiro modelo de IA multimodal completo nativo do mundo, que suporta o processamento unificado de texto, imagens, áudio e vídeo. O modelo demonstra desempenho avançado em várias áreas e está aberto ao público, atendendo às necessidades multilíngues dos usuários globais.

【Resumo da AiBase:】
🌟 O Qwen3-Omni é o primeiro modelo de IA multimodal completo do mundo, capaz de processar texto, imagens, áudio e vídeo de forma unificada.
🌐 O modelo suporta 119 idiomas de texto e 19 tipos de entrada de voz, atendendo às necessidades multilíngues dos usuários globais.
🖼️ O novo Qwen-Image-Edit-2509 suporta edição múltipla de imagens, melhorando significativamente a consistência e o efeito da edição.
Link detalhado: https://github.com/QwenLM/Qwen3-Omni huggingface: https://huggingface.co/collections/Qwen/qwen3-omni-68d100a86cd0906843ceccbe
2. Acabe com os problemas de edição de imagem! A Alibaba Qwen-Image oferece uma função de edição múltipla de imagem para criar filmes publicitários profissionais com um clique
O artigo apresenta uma grande atualização na funcionalidade da ferramenta de edição de imagem da IA da Alibaba, incluindo a nova função de edição múltipla de imagem, a introdução da tecnologia de mapa de pontos-chave do ControlNet e a expansão das aplicações para a criação de memes, fornecendo soluções mais eficientes para os setores de comércio eletrônico e marketing digital.

【Resumo da AiBase:】
🖼️ Nova função de edição múltipla de imagem, suportando combinações flexíveis de pessoa + pessoa, pessoa + produto e pessoa + cenário.
⚙️ Introduz a função de mapa de pontos-chave do ControlNet, aumentando a precisão do controle da postura humana.
🛒 Expande as aplicações, suportando a criação de memes, auxiliando os setores de comércio eletrônico e marketing.
Link detalhado: https://chat.qwen.ai/?inputFeature=image_edit
3. Baidu lança o modelo Qianfan-VL, modelos em diferentes tamanhos atendem a diferentes cenários
O time de inteligência artificial da Baidu Cloud lançou um novo modelo de compreensão visual chamado Qianfan-VL, que inclui três tamanhos: 3B, 8B e 70B, otimizado profundamente para aplicações multimodais empresariais. O Qianfan-VL se destaca em OCR, cenas educacionais e resolução de matemática, mostrando capacidade geral excelente e desempenho superior em tarefas específicas nos testes padrão.

【Resumo da AiBase:】
🧠 Modelos em diferentes tamanhos atendem a diferentes cenários.
📊 Os modelos de 8B e 70B possuem capacidade de raciocínio e pensamento.
📄 Desempenho excepcional em OCR e compreensão de documentos.
Link detalhado: https://baidubce.github.io/Qianfan-VL/
4. Google lança o protocolo AP2, colaborando com PayPal para iniciar uma nova era de pagamentos com IA
O protocolo AP2 da Google fornece um framework seguro e confiável para pagamentos com IA, garantindo a legalidade e segurança das transações por meio de mecanismos de token de autorização, enquanto colabora com o PayPal para impulsionar a inovação e aplicação da IA no setor de pagamentos.

【Resumo da AiBase:】
🛒 O protocolo AP2 fornece um mecanismo de autorização seguro para pagamentos com IA, garantindo a legalidade das transações.
🤝 A Google colabora com o PayPal para impulsionar a aplicação prática da IA no setor de pagamentos.
🔒 O sistema de tokens de autorização define claramente as responsabilidades, aumentando a transparência das transações.
Link detalhado: https://github.com/google-agentic-commerce/AP2
5. Apple expande sua plataforma de geração de imagens: Image Playground irá introduzir mais modelos de IA de terceiros
A Apple realizou uma atualização significativa no Image Playground nas versões macOS Tahoe26, iPadOS26 e iOS26, introduzindo o ChatGPT como modelo de geração de imagens e planejando suportar mais modelos de terceiros, como o Gemini2.5Flash Image da Google.

【Resumo da AiBase:】
🍎 A Apple expandiu o Image Playground para suportar mais modelos de IA de terceiros, incluindo o OpenAI e o Gemini2.5Flash Image da Google.
⚙️ Novo indicador "estimativa de atraso" e "identificador de marca", indicando que a Apple está otimizando o mecanismo de seleção de modelos.
🔒 A Apple pode preferir parcerias com parceiros externos, em vez de apoiar diretamente modelos de código aberto, para garantir a segurança das ferramentas de geração de imagens.
6. Transforme-se em uma máquina de estudo em um clique! O Baidu Search lança o AI Companion
O Baidu lançou o AI Companion, transformando celulares comuns em máquinas de estudo por meio de tecnologia de IA, fornecendo funções como exercícios precisos e treinamento de fala para estudantes, ajudando a promover a equidade educacional e a difusão de recursos.

【Resumo da AiBase:】
📚 O AI Companion do Baidu transforma celulares comuns em máquinas de estudo por meio de tecnologia de IA, melhorando a equidade educacional.
🗣️ Oferece ferramentas como fala AI e correção de ensaios, ajudando os alunos a aprender de forma personalizada.
🌍 A equipe de educação do Baidu usa tecnologias como Wenshin 4.5 para promover a integração e difusão de recursos educacionais.
7. Assistente de Tabela AI do DingTalk lançado oficialmente: uma frase gera uma tabela, construindo uma plataforma de aplicativos empresariais de IA
O DingTalk lançou o Assistente de Tabela AI, transformando a Tabela AI em uma plataforma de criação de aplicativos voltada para a era da IA. Os usuários precisam apenas atualizar para a versão mais recente para experimentar essa nova função. O Assistente de Tabela AI suporta descrições de ideias em linguagem natural, geração automática de tabelas, fluxos de trabalho automatizados e painéis de análise de dados, reduzindo significativamente a barreira de uso.

【Resumo da AiBase:】
✨ O Assistente de Tabela AI suporta descrições de ideias em linguagem natural, gerando automaticamente tabelas, fluxos de trabalho automatizados e painéis de análise de dados.
🚀 Introduziu o agente de campo, adicionou 30 agentes e suporta capacidades de IA multimodal, como compreensão de vídeo e personagens digitais.
🌐 Suporte a fluxos de trabalho entre plataformas, adicionou suporte a fluxos de trabalho de plataformas como BaiLian e Coze, permitindo a coleta e análise de dados entre plataformas.
8. DeepSeek-V3.1-Terminus é lançado com destaque: desempenho totalmente aprimorado, capacidade de raciocínio profundo significativamente fortalecida
A DeepSeek lançou o modelo DeepSeek-V3.1-Terminus e o tornou aberto ao público. O modelo corrigiu problemas de inconsistência linguística e caracteres anormais em relação à versão anterior, otimizou o desempenho de agentes de programação e busca. Os resultados de testes básicos mostram que o desempenho foi melhorado em 0,2% a 36,5%, especialmente destacando-se em conhecimento de alto nível, multimodalidade e raciocínio profundo.

【Resumo da AiBase:】
🧠 O modelo DeepSeek-V3.1-Terminus tem desempenho totalmente aprimorado, com aumento de 0,2% a 36,5%
🚀 Otimizou especialmente o desempenho de agentes de programação e busca, corrigindo problemas de inconsistência linguística da versão anterior.
🔍 Excelente desempenho no teste HLE, demonstrando forte capacidade de raciocínio profundo e processamento multimodal.
Link detalhado: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
9. O serviço de assinatura Kimi Agent chega com surpresas! Doação se torna 9 meses de VIP, 49 yuan para pesquisa profunda em IA
A Kimi lançou um novo serviço de assinatura de Agent, oferecendo benefícios adicionais aos usuários antigos que fizeram doações, enquanto o sistema de assinatura baseado em nomes de batidas musicais demonstrou criatividade da marca. A função de pesquisa profunda baseia-se em modelos próprios, fornecendo insights profissionais e impulsionando a evolução dos assistentes de IA para agentes inteligentes.

【Resumo da AiBase:】
✨ A Kimi lançou o serviço de assinatura Agent, os usuários que fizeram doações recebem tempo adicional de assinatura.
🎵 O sistema de assinatura é nomeado com termos de batidas de música clássica, combinando arte e tecnologia.
🔍 A função de pesquisa profunda baseia-se em modelos próprios, fornecendo análises multidimensionais e descobertas cognitivas.
10. O primeiro modelo global de inteligência corporal universal é aberto ao público! O GO-1 da Zhiyuan Robot choca o mercado
A Zhiyuan Robot anunciou que o modelo base de inteligência corporal universal GO-1 está totalmente aberto ao público, sendo o primeiro modelo de inteligência corporal com arquitetura ViLLA no mundo, capaz de compreender e executar tarefas complexas. Essa medida promoverá a aplicação e pesquisa da inteligência corporal, reduzirá a barreira tecnológica e atrairá mais desenvolvedores para participar dessa ecossistema, estimulando inovação e cooperação interdisciplinar.

【Resumo da AiBase:】
🤖 O GO-1 é o primeiro modelo de inteligência corporal com arquitetura ViLLA no mundo, combinando capacidade visual, linguística e ação potencial.
💡 A abertura do GO-1 promoverá a aplicação e pesquisa da inteligência corporal, reduzindo a barreira tecnológica.
🌐 A Zhiyuan Robot deseja atrair mais desenvolvedores para participar do ecossistema de inteligência corporal, estimulando inovação e cooperação interdisciplinar.





