Bem-vindo ao programa "AI Daily"! Aqui é o seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os conteúdos mais quentes do setor de IA, focando nos desenvolvedores, ajudando-o a compreender as tendências tecnológicas e conhecer aplicações inovadoras de produtos de IA.

Novos produtos de IA clicar para mais informações:https://top.aibase.com/

1. Kuaishou Keling 2.1 lança nova função de quadro inicial e final

O modelo Kuaishou Keling 2.1 lançou uma nova função de quadro inicial e final, melhorando significativamente a qualidade e a fluidez da geração de vídeos, otimizando também os efeitos de transição e a capacidade de resposta ao texto. O modelo apresenta melhorias notáveis em desempenho dinâmico, compreensão semântica e eficiência de geração, adequando-se a diversos cenários profissionais de criação de vídeos.

image.png

【Resumo do AiBase:】

🎥 A versão 2.1 do Keling adiciona a nova função de quadro inicial e final, permitindo um controle mais preciso nas partes inicial e final dos vídeos.

💡 Suporte para imagens personalizadas de quadro inicial e final, resolvendo problemas de transições rígidas, ideal para criação profissional de vídeos.

⚡ A velocidade de geração e o custo diminuíram, aumentando a eficiência para os criadores.

2. Kunlun Wanhui lança o modelo de música AI Mureka V7.5 e o modelo de síntese de voz MoE-TTS

A empresa Kunlun Wanhui lançou o modelo Mureka V7.5 em 15 de agosto de 2025, marcando o encerramento bem-sucedido da semana de tecnologia SkyWork AI. O modelo se destaca na criação de músicas em chinês, melhorando a realidade e profundidade emocional da voz humana, combinando-se com o framework de síntese de voz MoE-TTS, aumentando a naturalidade e o controle da síntese de voz.

image.png

【Resumo do AiBase:】

🎧 O Mureka V7.5 demonstra habilidades excepcionais na criação de músicas em chinês, incluindo melodia, técnica de toque, pronúncia e expressão emocional.

🎤 O MoE-TTS controla com precisão características e estilos de voz com descrições em linguagem natural, resolvendo problemas de geração de voz que fogem às expectativas.

🌐 A Kunlun Wanhui demonstrou sua força no campo de criação musical e síntese de voz com IA, oferecendo novas ideias para pesquisas e desenvolvimento nesses setores.

3. Tencent Cloud lança a ferramenta de desenvolvimento AI CloudBase AI CLI que reduz 80% da quantidade de código

A Tencent Cloud lançou a CloudBase AI CLI, uma ferramenta de linha de comando integrada profundamente à plataforma de desenvolvimento em nuvem, destinada a oferecer aos desenvolvedores uma experiência de desenvolvimento mais eficiente e conveniente. A ferramenta suporta várias ferramentas de programação AI por meio de uma interface de linha de comando unificada, aumentando significativamente a eficiência do desenvolvimento e abrangendo todo o processo desde a geração de código até a implantação de aplicações.

image.png

【Resumo do AiBase:】

🔥 A CloudBase AI CLI fornece uma interface de linha de comando unificada, simplificando o processo de desenvolvimento.

🌐 Suporta portabilidade entre plataformas e capacidade de colaboração entre múltiplos modelos, atendendo às necessidades de diferentes cenários de desenvolvimento.

💡 Oferece quotas gratuitas de uso, reduzindo a barreira de entrada e aumentando o custo-benefício da IA.

Link detalhado: https://static.cloudbase.net/cli/install/install.sh -fsS | bash

4. Novo produto internacional MuleRun explode! Cada pessoa tem sua própria máquina virtual, o Agente de IA joga jogos e faz modelagem automaticamente

O MuleRun, como um produto inovador de IA, traz uma experiência de inteligência artificial totalmente nova por meio de mecanismos únicos de máquina virtual e uma ecologia de Agentes baseada na comunidade, demonstrando o potencial amplo de aplicação do Agente de IA em vários campos.

image.png

【Resumo do AiBase:】

🎮 O Agente de IA do MuleRun pode completar tarefas de jogo automaticamente, melhorando significativamente a experiência do usuário.

💻 O MuleRun fornece um ambiente de máquina virtual exclusivo para os usuários, suportando a execução de vários softwares e aplicações.

🌐 A ecologia de Agentes baseada na comunidade permite que usuários comuns usem ferramentas automatizadas facilmente, reduzindo a barreira tecnológica.

Link detalhado: https://discord.com/invite/kKAAEYay5F

5. Meta anuncia o DINOv3 de forma aberta! Um poderoso recurso de visão de IA sem marcação manual, revolucionando o futuro da identificação de imagens

A Meta AI abriu o modelo de reconhecimento de imagem genérico DINOv3, baseado em aprendizado não supervisionado, capaz de alcançar desempenho notável sem marcação manual, considerado uma nova etapa na tecnologia de visão de IA. O DINOv3 destaca-se na extração de características de alta resolução e adaptabilidade a múltiplas tarefas, sendo aplicável em diversos campos, como monitoramento ambiental, saúde, automação e outras áreas, reduzindo assim a barreira de desenvolvimento através da abertura.

image.png

【Resumo do AiBase:】

🧠 Aprendizado não supervisionado: extrai características automaticamente de imagens não rotuladas em grande escala.

🖼️ Extração de características de alta resolução: captura informações globais e detalhes locais simultaneamente, suportando várias tarefas visuais.

🚀 Aplicações amplas: aplicável em monitoramento ambiental, saúde, automação e outros campos transversais.

Link detalhado: https://github.com/facebookresearch/dinov3

6. Estrela do Réveillon conquista novamente! H1 da Yushu vence a medalha de ouro da corrida de 1500 metros pela primeira vez na história dos robôs

O robô humanoide H1 da Yushu Technology venceu a medalha de ouro da corrida de 1500 metros na primeira competição mundial centrada em robôs humanóides, demonstrando suas excelentes performances em velocidade e resistência.

image.png

【Resumo do AiBase:】

🏃‍♂️ O robô humanoide H1 da Yushu Technology venceu a medalha de ouro da corrida de 1500 metros na primeira competição mundial centrada em robôs humanóides.

🏆 Esta competição atraiu 280 equipes de 16 países e mais de 500 robôs humanóides, mostrando o nível mais alto da indústria.

🤖 O H1 foi otimizado no software para velocidade e resistência na corrida, demonstrando uma ruptura na velocidade e resistência extremas.

7. O Gemini da Google recebe uma atualização importante! Adiciona função de memória e modo de conversa privada

A Google lançou duas novas funções para o assistente de IA Gemini — a função de memória e o modo de conversa temporária, marcando uma importante evolução nos serviços personalizados e proteção de privacidade para assistentes de IA. A função de memória pode aprender continuamente as informações do usuário, fornecendo serviços mais precisos; enquanto o modo de conversa temporária garante que os conteúdos das conversas não sejam salvos, protegendo a privacidade do usuário.

image.png

【Resumo do AiBase:】

🧠 A função de memória registra preferências e hábitos do usuário, melhorando a experiência de serviço personalizado.

🔒 O modo de conversa temporária garante a privacidade, garantindo que as conversas não sejam salvas ou usadas para treinamento.

💡 Essas duas funções representam avanços duplos em personalização e proteção de privacidade para assistentes de IA.

8. Universidade de Hong Kong se une ao projeto open-source OpenCUA, criando um assistente inteligente personalizado para computadores!

A Universidade de Hong Kong, em parceria com várias instituições, lançou o framework OpenCUA, visando ajudar os desenvolvedores a construir agentes de uso computacional personalizados (CUA), melhorando a produtividade dos usuários. O framework fornece suporte abrangente de dados e ferramentas poderosas, demonstrando seu potencial no desenvolvimento de assistentes inteligentes.

image.png

【Resumo do AiBase:】

🧠 O framework OpenCUA fornece uma infraestrutura de anotação sem falhas para capturar demonstrações de operações humanas em computadores.

📊 Integra o conjunto de dados AgentNet, abrangendo mais de 200 aplicações e sites, suportando múltiplos sistemas operacionais.

🚀 Suporta fluxos de trabalho escaláveis, convertendo demonstrações em pares “estado-acção”, melhorando a capacidade de raciocínio longo.

Link detalhado: https://opencua.xlang.ai/

9. A OpenAI pode introduzir anúncios no ChatGPT, executivo diz que "manter flexibilidade é importante"

A OpenAI está explorando maneiras de aumentar seus ganhos, incluindo a introdução de anúncios no ChatGPT. Embora o executivo Nick Turley tenha dito que os anúncios devem ser tratados com cuidado para evitar prejudicar a experiência do usuário, a empresa ainda considera adotar o modelo de anúncios em outros produtos. Além disso, o modelo de assinatura ainda tem grande potencial de crescimento.

image.png

【Resumo do AiBase:】

📌 A OpenAI considera introduzir anúncios no ChatGPT, mas precisa tratar com cuidado para garantir a experiência do usuário.

💡 O executivo acredita que o modelo de assinatura ainda tem grande potencial de crescimento, com muitas oportunidades não exploradas.

📈 A OpenAI espera que a receita de assinaturas alcance 12,7 bilhões de dólares em 2024, mas só alcançará fluxo de caixa positivo em 2029.

10. Google lança modelo de IA de baixo custo e eficiente Gemma 3 270M, pode funcionar em smartphones

A DeepMind do Google lançou o modelo de IA aberto Gemma3270M, com 270 milhões de parâmetros, pequeno em volume e eficiente em energia, suportando operação offline em dispositivos leves como smartphones e Raspberry Pi. Ele se sai bem em tarefas de seguir instruções e possui capacidade de ajuste rápido, adequando-se a cenários empresariais e criativos.

image.png

【Resumo do AiBase:】

🧠 O Gemma3270M é um modelo de IA aberto com 270 milhões de parâmetros, adequado para funcionar em smartphones.

⚡ Excelente desempenho em tarefas de seguir instruções, testes internos mostram que consome apenas 0,75% da bateria, alta eficiência energética.

📱 Suporta ajuste rápido, adequado para desenvolvimento corporativo e aplicações criativas, atendendo a necessidades diversificadas.

Link detalhado: https://developers.googleblog.com/en/introducing-gemma-3-270m/