Bem-vindo ao programa "AI Daily"! Aqui é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias, apresentamos os conteúdos mais quentes no campo da IA, focando nos desenvolvedores, ajudando você a compreender as tendências tecnológicas e conhecer aplicações inovadoras de produtos de IA.

Produtos de IA novos clique para saber mais:https://app.aibase.com/zh

1. A função de quadro inicial e final do Hailuo AI da MiniMax está oficialmente disponível nas versões web e app

A função de quadro inicial e final do Hailuo AI foi oficialmente lançada nas versões web e app, e também abriu a jogabilidade apenas com o quadro final. Essa tecnologia melhora significativamente o limite das capacidades de quadro inicial e final da indústria por meio de uma compreensão mais forte das instruções, efeitos dinâmicos mais suaves e uma imaginação mais corajosa.

image.png

【Resumo do AiBase:】

🧠 Capacidade mais forte de seguir instruções complexas, compreendendo e executando cada detalhe com precisão

🎬 Geração de dinâmica física extremamente complexa, como combate, ginástica e outros movimentos poderosos, com sequências suaves

🎨 Funcionalidade de imaginação além do esperado, realizando desempenho acima do esperado quando há grandes lacunas entre os quadros inicial e final ou quando as instruções são poucas

2. A Yeshi Technology lançou o Wenda Xiao Bai 5, desafiando o GPT-5, trazendo um novo padrão nacional de IA

O produto principal Wenda Xiao Bai 5 da Yeshi Technology alcançou o GPT-5 em várias avaliações de desempenho, marcando uma importante quebra na tecnologia de modelos grandes nacionais. Este sistema possui um modo de pensamento dinâmico, adequado para vários campos e se destaca em habilidades STEM, conhecimento avançado e programação de código.

image.png

【Resumo do AiBase:】

✨ O Wenda Xiao Bai 5 alcançou o GPT-5 em várias avaliações de desempenho, tornando-se um novo padrão nacional de IA.

🧠 Possui um modo de pensamento dinâmico, capaz de julgar inteligentemente quando responder rapidamente ou pensar profundamente.

📊 Excelente desempenho em habilidades STEM, conhecimento avançado e programação de código, com pontuação geral superior aos concorrentes.

3. OpenAI lança novo modelo de voz GPT-Realtime, projetado especificamente para Agentes de IA de voz

A OpenAI lançou um novo modelo de voz chamado GPT-Realtime, projetado especificamente para Agentes de IA de voz. Ele pode gerar voz natural e fluida, suportar entrada de imagem e troca de idioma. Sua capacidade de raciocínio e precisão de execução de instruções foram significativamente melhoradas, e ele também fornece funções de proteção de segurança robustas, adequadas para vários setores industriais.

image.png

【Resumo do AiBase:】

🎙️ O GPT-Realtime é um modelo multimodal de voz lançado pela OpenAI, projetado especificamente para Agentes de IA de voz.

🧠 Esse modelo possui capacidade de raciocínio e seguimento de instruções, aumentando o nível de inteligência nas interações de voz.

🔒 A API Realtime vem com medidas de proteção de segurança, garantindo privacidade e segurança dos dados dos usuários.

4. Acabe com a complicação! O Gemini AI da Google torna o tratamento de tabelas muito mais fácil

A Google introduziu o assistente Gemini AI, tornando o processamento de dados no Google Sheets mais inteligente e eficiente, melhorando a experiência do usuário.

image.png

【Resumo do AiBase:】

📊 O assistente Gemini AI da Google traz funcionalidades de processamento de dados inteligentes para o Google Sheets.

💡 A nova função "Converter para Tabela" analisa automaticamente e organiza os dados, aumentando a produtividade.

🔄 Os usuários podem personalizar expressões de fórmulas para adaptar-se às mudanças nos dados, sem precisar ajustar manualmente as fórmulas.

5. Revolução de dublagem de IA! A Tencent transforma máquinas em narradores profissionais, gerando efeitos sonoros de Hollywood com uma única frase

O artigo apresenta a tecnologia AudioStory desenvolvida pelo laboratório ARC da Tencent, que é capaz de gerar conteúdo de áudio de alta qualidade com base em descrições textuais, possuindo uma forte capacidade narrativa. Ela realiza tarefas complexas de geração de áudio através de uma estratégia de divisão e mecanismo de conexão desconectada.

image.png

【Resumo do AiBase:】

✨ A tecnologia AudioStory é capaz de gerar conteúdo de áudio de filme com base em descrições textuais.

🧠 Utiliza uma estratégia de divisão para decompor histórias complexas em eventos de áudio ordenados.

🔄 Mecanismo de conexão desconectada garante correspondência precisa entre a qualidade do áudio e o significado.

Link detalhado: https://arxiv.org/pdf/2508.20088

6. A Baidu planeja formar 10 milhões de especialistas em IA nos próximos cinco anos

O artigo apresenta o plano da Baidu de formar 10 milhões de especialistas em IA nos próximos cinco anos, enquanto mostra seus investimentos contínuos e resultados inovadores no campo da inteligência artificial. Além disso, o artigo menciona que a receita das novas atividades de IA da Baidu teve um desempenho notável, demonstrando sua competitividade no mercado.

image.png

【Resumo do AiBase:】

🌟 A Baidu planeja formar mais 10 milhões de especialistas em IA nos próximos cinco anos, impulsionando o desenvolvimento da indústria.

📈 O relatório da Baidu sobre o segundo trimestre de 2025 mostrou que a receita das novas atividades de IA ultrapassou 10 bilhões de yuans, crescendo 34% em relação ao ano anterior.

🎓 A formação de talentos será realizada por meio de parcerias com universidades, treinamentos corporativos e educação online.

7. Um professor de IA contra fraudes surge! MathGPT.ai teve sucesso nos testes em 30 universidades nos EUA e será amplamente implantado no outono

A MathGPT.ai redefine o papel da IA na educação matemática por meio da metodologia socrática e do mecanismo de controle liderado pelos professores. A plataforma não só oferece serviços de tutoria contra fraude, mas também suporta cursos universitários de matemática e se integra a sistemas de gestão de aprendizagem principais, garantindo acesso sem obstáculos.

image.png

【Resumo do AiBase:】

🧠 A MathGPT.ai utiliza a técnica de perguntas socráticas para incentivar o pensamento crítico dos alunos, em vez de obter respostas diretamente.

🔒 Os professores podem controlar como os alunos usam ferramentas de IA, incluindo se a IA fornece suporte de estudo.

🌐 A plataforma já está integrada com Canvas, Blackboard e Brightspace e é compatível com leitores de tela, melhorando a experiência de acesso acessível.

8. O Xcode da Apple integra pesado Claude Sonnet4: A era da revolução de IA para desenvolvedores iOS chega

A Apple integrou oficialmente o modelo de IA Claude Sonnet4 no Xcode26Beta7, trazendo uma experiência de programação inteligente para os desenvolvedores de iOS. Esse modelo é capaz de gerar código de alta qualidade, localizar erros e repará-los automaticamente, e a nova funcionalidade inline playgrounds permite que os desenvolvedores executem e testem código diretamente nas linhas de código, aumentando a eficiência de desenvolvimento.

image.png

【Resumo do AiBase:】

🍎 Integração do modelo de IA Claude Sonnet4, melhorando a capacidade de geração de código e correção de erros.

🧪 Nova funcionalidade inline playgrounds, suportando a execução de exemplos de código em tempo real.

🔒 Implementado com base nas interfaces oficiais da Apple, garantindo estabilidade e segurança da função.

9. Microsoft lança seu primeiro modelo de IA desenvolvido internamente MAI-Voice-1 e MAI-1-preview, competindo com a OpenAI

A Microsoft lançou seu primeiro modelo de IA desenvolvido internamente MAI-Voice-1 e MAI-1-preview, o que marca um progresso importante na área de inteligência artificial e fortalece sua competição com a OpenAI. O MAI-Voice-1 é capaz de gerar áudio rapidamente e já foi aplicado em funcionalidades como Copilot Daily; enquanto o MAI-1-preview se concentra em ajudar com consultas diárias e será usado no processamento de texto do assistente de IA Copilot no futuro.

image.png

【Resumo do AiBase:】

🗣️ O MAI-Voice-1 é capaz de gerar áudio rapidamente e já foi aplicado em várias funções, como Copilot Daily.

🚀 O MAI-1-preview será usado no processamento de texto do assistente de IA Copilot, marcando um novo avanço da Microsoft no setor de IA de consumo.

🌟 A Microsoft lançou dois modelos de IA desenvolvidos internamente, MAI-Voice-1 e MAI-1-preview, aumentando sua competitividade com a OpenAI.

Link detalhado: https://microsoft.ai/news/two-new-in-house-models/

10. A xAI apresenta oficialmente Grok Code Fast1: Modelo de codificação rápido e econômico eficiente

A xAI apresentou o Grok Code Fast1, um modelo de linguagem grande especialmente desenvolvido para o desenvolvimento de software. Esse modelo demonstra desempenho notável em capacidade de raciocínio e geração de código e já está disponível gratuitamente em várias plataformas de programação inteligente principais.

image.png

【Resumo do AiBase:】

🚀 O Grok Code Fast1 adota uma nova arquitetura leve, melhorando a velocidade do serviço e a taxa de acerto da cache.

🌐 Suporta múltiplas plataformas, como GitHub Copilot e Cursor, oferecendo teste gratuito para atrair desenvolvedores a experimentarem.

💰 A estratégia de preços é competitiva, com 0,20 dólares por milhão de tokens de entrada e 1,50 dólares por token de saída, adequado para desenvolvedores com orçamento limitado.

Link detalhado: https://x.ai/news/grok-code-fast-1

11. SuperCLUE Multimodal Visual - Classificação de agosto: Gemini-2.5-Pro lidera

No ranking do benchmark chinês de modelos de linguagem visual multimodal (SuperCLUE-VLM) divulgado em 28 de agosto, o Gemini-2.5-Pro lidera com 74,99 pontos, seguido pelo GPT-5(high) da OpenAI com 68,59 pontos. Esse ranking constrói um sistema de avaliação com base em três dimensões: cognição básica, raciocínio visual e aplicação visual, visando fornecer padrões objetivos e justos para modelos de linguagem visual multimodal.

image.png

【Resumo do AiBase:】

🧠 O Gemini-2.5-Pro lidera o ranking SuperCLUE-VLM com 74,99 pontos, demonstrando fortes capacidades multimodais.

📊 O teste envolve 15 modelos multimodais, incluindo Claude-Opus-4.1 e GPT-5(high), entre outros modelos principais nacionais e internacionais.

🏆 O ERNIE-4.5-Turbo-VL da Baidu e outros modelos nacionais estão empatados, mostrando uma forte competitividade no mercado.