Bem-vindo ao quadro de notícias do 【AI Daily】! Aqui é o seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos as principais notícias do setor de IA, com foco nos desenvolvedores, ajudando você a entender as tendências tecnológicas e conhecer novas aplicações inovadoras de IA.

Produtos de IA frescos clicando para saber mais: https://top.aibase.com/

1. O lado escuro da Lua lança uma nova versão open source Kimi-Dev-72B que quebra recordes em benchmarks de programação

O lado escuro da Lua lançou um modelo open source Kimi-Dev-72B focado em tarefas de engenharia de software, obtendo a pontuação mais alta no teste SWE-bench Verified, superando o DeepSeek-R1 com 7,2 bilhões de parâmetros, demonstrando sua capacidade poderosa na área de programação.

image.png

[Resumo AiBase:]

🚀 Com apenas 7,2 bilhões de parâmetros, o Kimi-Dev-72B obteve 60,4% de pontuação no teste SWE-bench Verified, tornando-se um novo marco nos modelos open source.

🔍 O modelo combina papéis de corretor de bugs e escritor de testes, garantindo a qualidade e correção do código, melhorando o desempenho por meio de mecanismos de autopesquisa.

🌟 O plano futuro inclui integração profunda com ferramentas populares de desenvolvimento, otimizando continuamente e lançando versões mais poderosas.

2. MiniMax-M1 está disponível como open source! Com capacidade de inferência de 1M de contexto, o novo rei da IA foi criado por apenas US$ 530 mil!

O MiniMax-M1 chamou atenção por sua capacidade de inferência de longo contexto, baixo custo de treinamento e características open source, destacando-se entre os modelos open source.

image.png

[Resumo AiBase:]

Contexto de janela de até 1M entrada e 80k saída, muito além do GPT-4o, ideal para análise de documentos complexos e diálogos multietapas.

Custo de treinamento de apenas US$ 530 mil, alcançando eficiência de inferência e baixo custo através da arquitetura MoE e algoritmo CISPO.

Disponível na plataforma Hugging Face, suporta orçamentos de pensamento de 40k e 80k, com desempenho equivalente aos melhores modelos comerciais.

3. Tencent LeVo está chegando! Modelo de IA para canto semelhante ao Suno 4.5, com clonagem de timbre de amostra zero

O modelo LeVo da equipe de IA da Tencent causou impacto com suas capacidades avançadas de clonagem de timbre, geração de faixas separadas e alta fidelidade musical, destacando-se em várias métricas-chave em comparação com o Suno4.5, além de suportar clonagem de timbre e geração de faixas separadas com amostras zero.

image.png

[Resumo AiBase:]

🌟 Suporta clonagem de timbre com amostras zero, copiando precisamente o timbre em apenas 3 segundos de áudio, reduzindo significativamente a barreira de criação musical.

🎵 Modo de geração de faixas separadas, suportando separação de vozes e acompanhamento, proporcionando maior flexibilidade para produção musical profissional.

🌐 Publicado sob forma open source, promovendo o desenvolvimento da comunidade global de criação musical e aumentando a influência internacional da tecnologia chinesa de IA.

Link para detalhes: https://levo-demo.github.io/

4. Alibaba Lança Atualização Qwen3, Adequada à Arquitetura MLX da Apple

Eu espero muito pelo sucesso dessa colaboração entre a Alibaba e a Apple. A atualização Qwen3 não apenas suporta mais idiomas, mas também melhora o desempenho e a capacidade de inferência, marcando um passo importante para o desenvolvimento da inteligência da Apple no mercado chinês.

image.png

[Resumo AiBase:]

🌟 A Alibaba lançou a atualização Qwen3, compatível com a arquitetura MLX da Apple, impulsionando o desenvolvimento da inteligência da Apple na China.

📱 A nova versão Qwen3 suporta 119 idiomas, com desempenho e capacidade de inferência mista melhorados.

🚀 A inteligência da Apple ainda não está disponível na China, mas pode ser exibida como prévia no iOS18.6 beta oficial.

5. O computador de mesa e a versão web do DouBao adicionam a função "Podcast de IA"

O DouBao lançou a nova funcionalidade 'Podcast de IA', que gera podcasts naturais de dupla conversa a partir do upload de PDF ou links, revolucionando a maneira como as informações são recebidas.

image.png

[Resumo AiBase:]

🌟 Basta fazer o upload de um PDF ou link para gerar rapidamente um podcast de conversa natural fluído.

🏃‍♂️ Aplicável a diversas situações, como trabalho e estudo, utilizando tempo fragmentado para obter informações de forma eficiente.

🎙️ O efeito de voz é realista, sem sensação robótica, oferecendo uma experiência auditiva imersiva.

6. O App Quark lança "Professor Quark" com capacidades de tutoria personalizada de IA

O aplicativo Quark lançou um novo produto educacional chamado 'Professor Quark', que possui recursos poderosos como explicar questões, revisar trabalhos, criar questões e buscar provas, especialmente forte na resolução de problemas de matemática e física. Além disso, ele tem a capacidade de ensino personalizado, analisando os dados de aprendizado dos alunos para fornecer tutoria personalizada.

image.png

[Resumo AiBase:]

✨ Integra múltiplas funções de aprendizado, como explicar questões, revisar trabalhos, criar questões e buscar provas, com análise profunda de questões de matemática e física.

🎯 Pode fornecer tutoria personalizada de acordo com as características dos estudantes, simulando a abordagem de ensino de um professor humano para ajudar os alunos a entender e melhorar seus resultados de aprendizado.

📚 Possui vastos recursos de banco de questões, incluindo bancos de questões especializados e provas verdadeiras de escolas famosas, atendendo às necessidades diversificadas de aprendizado.

7. O novo modelo multi-modal OmniFlow da Panasonic permite livre transição entre texto, imagem e áudio

Eu sou muito otimista sobre este modelo multi-modal OmniFlow, pois ele pode converter facilmente texto, imagem e áudio, permitindo que os usuários personalizem os resultados de geração de acordo com suas necessidades, aumentando consideravelmente a flexibilidade e a eficiência das operações.

image.png

[Resumo AiBase:]

🌟 O OmniFlow suporta a conversão eficiente entre texto, imagem e áudio, trazendo uma nova experiência multi-modal.

⚙️ Utiliza design modular, com cada componente previamente treinado independentemente, melhorando a eficiência do uso de recursos e otimizando os resultados do treinamento.

🎯 Introduz mecanismos de orientação multi-modal, permitindo que os usuários controlem precisamente o processo de geração, atendendo a demandas diversificadas.

8. Novo recurso Symphony AI da TikTok: imagens transformadas em vídeos, texto direto em anúncios

A TikTok lançou três ferramentas de criação de vídeo com IA, incluindo 'Imagem para Vídeo', 'Texto para Vídeo' e 'Showcase Products', visando simplificar o fluxo de produção de conteúdo publicitário para marcas. Essas ferramentas estão integradas ao Symphony Creative Studio e colaboram com Adobe Express e WPP Open, aumentando a eficiência dos anunciantes.

image.png

[Resumo AiBase:]

✨ A função de imagem para vídeo permite transformar imagens estáticas em vídeos dinâmicos, basta carregar a imagem e adicionar dicas de texto para gerar várias opções de vídeo via IA.

📝 A função de texto para vídeo não precisa de imagens ou modelos, basta usar o texto para criar vídeos, ajudando os anunciantes a testar e aperfeiçoar suas ideias rapidamente.

🛍️ A ferramenta Showcase Products combina imagens de produtos com avatares digitais, criando experiências publicitárias imersivas, elevando o estilo de conteúdo original do usuário.

9. ZEEKR e Volcano Engine se unem, o modelo grande DouBao impulsiona novas experiências de cabine inteligente

A ZEEKR Automobile e a Volcano Engine se associaram, integrando o modelo grande DouBao na nova versão do ZEEKR AI OS, aprimorando os serviços da cabine inteligente e otimizando a personalização da experiência.

image.png

[Resumo AiBase:]

O modelo grande DouBao foi integrado à cabine inteligente da ZEEKR, realizando recomendações precisas e serviços personalizados.

O assistente de voz inteligente da ZEEKR, Eva, suporta a troca de interações tradicionais de voz para serviços de modelo de linguagem grande sem interrupção.

O 50º veículo ZEEKR 009 brilhou na linha de montagem, estabelecendo um recorde de velocidade para modelos de veículos elétricos de luxo.

10. Nova quebra de limite nos modelos grandes! O Meta Llama 3.1 lembra 42% do conteúdo de Harry Potter!

Pesquisadores da Universidade de Stanford e outros institutos mostraram que o modelo Llama3.170B da Meta se destaca na memória textual, especialmente em livros populares como Harry Potter.

image.png

[Resumo AiBase:]

📚 O modelo Llama3.170B lembra 42% do conteúdo de Harry Potter, muito acima dos 4,4% do Llama165B.

🔍 A pesquisa utiliza a base de dados Books3, testando a memória do modelo marcando segmentos de texto.

🌟 O desempenho nas memórias de livros populares é notável, mostrando o progresso da IA na compreensão e processamento de texto.

11. Função de Tarefas Grok entra com força! Acompanhe temas populares periodicamente, a eficiência da IA supera o ChatGPT

O assistente de IA Grok, da xAI, lançou uma nova função de tarefas periódicas, automatizando consultas e notificações externas, proporcionando uma experiência conveniente e eficiente para os usuários.

image.png

[Resumo AiBase:]

🌟 Suporta diversas frequências de tarefas, desde instantâneas até rastreamento a longo prazo, atendendo a diferentes necessidades.

📧 Fornece funcionalidade de notificação externa, como envio de e-mails, resultando em resultados ativos para os usuários, melhorando a praticidade do uso.

🏆 Os usuários do SuperGrok têm cotas mais altas e prioridade para experimentar recursos avançados, como DeepSearch e Big Brain Mode.

12. O Gemini 2.5 Pro está prestes a atualizar a função Deep Think

Como assistente de IA, eu espero ansiosamente pelas novas funcionalidades do Deep Think do Gemini 2.5 Pro. Esta função não só melhora a capacidade de raciocínio da IA em tarefas complexas, mas também faz importantes melhorias na experiência do usuário e na segurança. O lançamento do Deep Think me mostra o potencial infinito da aplicação da IA em áreas profissionais.

image.png

[Resumo AiBase:]