Bem-vindo ao quadro de notícias do 【AI Daily】! Aqui é o seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos as principais notícias do setor de IA, com foco nos desenvolvedores, ajudando você a entender as tendências tecnológicas e conhecer novas aplicações inovadoras de IA.
Produtos de IA frescos clicando para saber mais: https://top.aibase.com/
1. O lado escuro da Lua lança uma nova versão open source Kimi-Dev-72B que quebra recordes em benchmarks de programação
O lado escuro da Lua lançou um modelo open source Kimi-Dev-72B focado em tarefas de engenharia de software, obtendo a pontuação mais alta no teste SWE-bench Verified, superando o DeepSeek-R1 com 7,2 bilhões de parâmetros, demonstrando sua capacidade poderosa na área de programação.
[Resumo AiBase:]
🚀 Com apenas 7,2 bilhões de parâmetros, o Kimi-Dev-72B obteve 60,4% de pontuação no teste SWE-bench Verified, tornando-se um novo marco nos modelos open source.
🔍 O modelo combina papéis de corretor de bugs e escritor de testes, garantindo a qualidade e correção do código, melhorando o desempenho por meio de mecanismos de autopesquisa.
🌟 O plano futuro inclui integração profunda com ferramentas populares de desenvolvimento, otimizando continuamente e lançando versões mais poderosas.
2. MiniMax-M1 está disponível como open source! Com capacidade de inferência de 1M de contexto, o novo rei da IA foi criado por apenas US$ 530 mil!
O MiniMax-M1 chamou atenção por sua capacidade de inferência de longo contexto, baixo custo de treinamento e características open source, destacando-se entre os modelos open source.
[Resumo AiBase:]
Contexto de janela de até 1M entrada e 80k saída, muito além do GPT-4o, ideal para análise de documentos complexos e diálogos multietapas.
Custo de treinamento de apenas US$ 530 mil, alcançando eficiência de inferência e baixo custo através da arquitetura MoE e algoritmo CISPO.
Disponível na plataforma Hugging Face, suporta orçamentos de pensamento de 40k e 80k, com desempenho equivalente aos melhores modelos comerciais.
3. Tencent LeVo está chegando! Modelo de IA para canto semelhante ao Suno 4.5, com clonagem de timbre de amostra zero
O modelo LeVo da equipe de IA da Tencent causou impacto com suas capacidades avançadas de clonagem de timbre, geração de faixas separadas e alta fidelidade musical, destacando-se em várias métricas-chave em comparação com o Suno4.5, além de suportar clonagem de timbre e geração de faixas separadas com amostras zero.
[Resumo AiBase:]
🌟 Suporta clonagem de timbre com amostras zero, copiando precisamente o timbre em apenas 3 segundos de áudio, reduzindo significativamente a barreira de criação musical.
🎵 Modo de geração de faixas separadas, suportando separação de vozes e acompanhamento, proporcionando maior flexibilidade para produção musical profissional.
🌐 Publicado sob forma open source, promovendo o desenvolvimento da comunidade global de criação musical e aumentando a influência internacional da tecnologia chinesa de IA.
Link para detalhes: https://levo-demo.github.io/
4. Alibaba Lança Atualização Qwen3, Adequada à Arquitetura MLX da Apple
Eu espero muito pelo sucesso dessa colaboração entre a Alibaba e a Apple. A atualização Qwen3 não apenas suporta mais idiomas, mas também melhora o desempenho e a capacidade de inferência, marcando um passo importante para o desenvolvimento da inteligência da Apple no mercado chinês.
[Resumo AiBase:]
🌟 A Alibaba lançou a atualização Qwen3, compatível com a arquitetura MLX da Apple, impulsionando o desenvolvimento da inteligência da Apple na China.
📱 A nova versão Qwen3 suporta 119 idiomas, com desempenho e capacidade de inferência mista melhorados.
🚀 A inteligência da Apple ainda não está disponível na China, mas pode ser exibida como prévia no iOS18.6 beta oficial.
5. O computador de mesa e a versão web do DouBao adicionam a função "Podcast de IA"
O DouBao lançou a nova funcionalidade 'Podcast de IA', que gera podcasts naturais de dupla conversa a partir do upload de PDF ou links, revolucionando a maneira como as informações são recebidas.
[Resumo AiBase:]
🌟 Basta fazer o upload de um PDF ou link para gerar rapidamente um podcast de conversa natural fluído.
🏃♂️ Aplicável a diversas situações, como trabalho e estudo, utilizando tempo fragmentado para obter informações de forma eficiente.
🎙️ O efeito de voz é realista, sem sensação robótica, oferecendo uma experiência auditiva imersiva.
6. O App Quark lança "Professor Quark" com capacidades de tutoria personalizada de IA
O aplicativo Quark lançou um novo produto educacional chamado 'Professor Quark', que possui recursos poderosos como explicar questões, revisar trabalhos, criar questões e buscar provas, especialmente forte na resolução de problemas de matemática e física. Além disso, ele tem a capacidade de ensino personalizado, analisando os dados de aprendizado dos alunos para fornecer tutoria personalizada.
[Resumo AiBase:]
✨ Integra múltiplas funções de aprendizado, como explicar questões, revisar trabalhos, criar questões e buscar provas, com análise profunda de questões de matemática e física.
🎯 Pode fornecer tutoria personalizada de acordo com as características dos estudantes, simulando a abordagem de ensino de um professor humano para ajudar os alunos a entender e melhorar seus resultados de aprendizado.
📚 Possui vastos recursos de banco de questões, incluindo bancos de questões especializados e provas verdadeiras de escolas famosas, atendendo às necessidades diversificadas de aprendizado.
7. O novo modelo multi-modal OmniFlow da Panasonic permite livre transição entre texto, imagem e áudio
Eu sou muito otimista sobre este modelo multi-modal OmniFlow, pois ele pode converter facilmente texto, imagem e áudio, permitindo que os usuários personalizem os resultados de geração de acordo com suas necessidades, aumentando consideravelmente a flexibilidade e a eficiência das operações.
[Resumo AiBase:]
🌟 O OmniFlow suporta a conversão eficiente entre texto, imagem e áudio, trazendo uma nova experiência multi-modal.
⚙️ Utiliza design modular, com cada componente previamente treinado independentemente, melhorando a eficiência do uso de recursos e otimizando os resultados do treinamento.
🎯 Introduz mecanismos de orientação multi-modal, permitindo que os usuários controlem precisamente o processo de geração, atendendo a demandas diversificadas.
8. Novo recurso Symphony AI da TikTok: imagens transformadas em vídeos, texto direto em anúncios
A TikTok lançou três ferramentas de criação de vídeo com IA, incluindo 'Imagem para Vídeo', 'Texto para Vídeo' e 'Showcase Products', visando simplificar o fluxo de produção de conteúdo publicitário para marcas. Essas ferramentas estão integradas ao Symphony Creative Studio e colaboram com Adobe Express e WPP Open, aumentando a eficiência dos anunciantes.
[Resumo AiBase:]
✨ A função de imagem para vídeo permite transformar imagens estáticas em vídeos dinâmicos, basta carregar a imagem e adicionar dicas de texto para gerar várias opções de vídeo via IA.
📝 A função de texto para vídeo não precisa de imagens ou modelos, basta usar o texto para criar vídeos, ajudando os anunciantes a testar e aperfeiçoar suas ideias rapidamente.
🛍️ A ferramenta Showcase Products combina imagens de produtos com avatares digitais, criando experiências publicitárias imersivas, elevando o estilo de conteúdo original do usuário.
9. ZEEKR e Volcano Engine se unem, o modelo grande DouBao impulsiona novas experiências de cabine inteligente
A ZEEKR Automobile e a Volcano Engine se associaram, integrando o modelo grande DouBao na nova versão do ZEEKR AI OS, aprimorando os serviços da cabine inteligente e otimizando a personalização da experiência.
[Resumo AiBase:]
O modelo grande DouBao foi integrado à cabine inteligente da ZEEKR, realizando recomendações precisas e serviços personalizados.
O assistente de voz inteligente da ZEEKR, Eva, suporta a troca de interações tradicionais de voz para serviços de modelo de linguagem grande sem interrupção.
O 50º veículo ZEEKR 009 brilhou na linha de montagem, estabelecendo um recorde de velocidade para modelos de veículos elétricos de luxo.
10. Nova quebra de limite nos modelos grandes! O Meta Llama 3.1 lembra 42% do conteúdo de Harry Potter!
Pesquisadores da Universidade de Stanford e outros institutos mostraram que o modelo Llama3.170B da Meta se destaca na memória textual, especialmente em livros populares como Harry Potter.
[Resumo AiBase:]
📚 O modelo Llama3.170B lembra 42% do conteúdo de Harry Potter, muito acima dos 4,4% do Llama165B.
🔍 A pesquisa utiliza a base de dados Books3, testando a memória do modelo marcando segmentos de texto.
🌟 O desempenho nas memórias de livros populares é notável, mostrando o progresso da IA na compreensão e processamento de texto.
11. Função de Tarefas Grok entra com força! Acompanhe temas populares periodicamente, a eficiência da IA supera o ChatGPT
O assistente de IA Grok, da xAI, lançou uma nova função de tarefas periódicas, automatizando consultas e notificações externas, proporcionando uma experiência conveniente e eficiente para os usuários.
[Resumo AiBase:]
🌟 Suporta diversas frequências de tarefas, desde instantâneas até rastreamento a longo prazo, atendendo a diferentes necessidades.
📧 Fornece funcionalidade de notificação externa, como envio de e-mails, resultando em resultados ativos para os usuários, melhorando a praticidade do uso.
🏆 Os usuários do SuperGrok têm cotas mais altas e prioridade para experimentar recursos avançados, como DeepSearch e Big Brain Mode.
12. O Gemini 2.5 Pro está prestes a atualizar a função Deep Think
Como assistente de IA, eu espero ansiosamente pelas novas funcionalidades do Deep Think do Gemini 2.5 Pro. Esta função não só melhora a capacidade de raciocínio da IA em tarefas complexas, mas também faz importantes melhorias na experiência do usuário e na segurança. O lançamento do Deep Think me mostra o potencial infinito da aplicação da IA em áreas profissionais.
[Resumo AiBase:]