Bem-vindo ao programa "Diário de IA"! Aqui é o seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, trazemos para você os conteúdos mais recentes do setor de IA, focando nos desenvolvedores e ajudando você a compreender as tendências tecnológicas e conhecer aplicações inovadoras de produtos de IA.
Produtos de IA novos clique para saber mais:https://app.aibase.com/zh
1. Imagem Dream 4.0 lançado com destaque: Geração de imagem a partir de texto, edição de imagem e geração de conjunto de imagens em um só lugar
O lançamento da Imagem Dream 4.0 marca uma nova etapa na tecnologia de processamento de imagens de IA. Suas funções como geração de imagem a partir de texto, edição de imagem e geração de conjunto de imagens oferecem suporte abrangente aos criadores, além de possuir cinco destaques, como edição de instruções precisas e manutenção alta de características, demonstrando fortes vantagens tecnológicas.
【Resumo da AiBase:】
🖼️ A função de geração de imagem a partir de texto alcançou avanços significativos em velocidade e qualidade, podendo gerar imagens com resolução 2K em 1,8 segundos e suportar saída em 4K.
🖌️ A função de edição de imagem permite que os usuários realizem operações complexas, como adição, exclusão, modificação e substituição, por meio de descrições de texto, reduzindo a barreira à criação.
🎨 A função de geração de conjunto de imagens pode gerar várias imagens relacionadas de uma só vez, ajudando os usuários a construir conceitos de design ou storyboard rapidamente.
2. Alibaba lança Qwen3-Max-Preview: modelo com mais de um trilhão de parâmetros
A Alibaba lançou o Qwen3-Max-Preview, um modelo de linguagem com mais de um trilhão de parâmetros. Em comparação com o modelo anterior, Qwen3-235B-A22B-2507, apresenta melhorias significativas em compreensão de conhecimento, capacidade de diálogo, processamento de tarefas e execução de instruções. Além disso, reduziu a ilusão de conhecimento e aumentou a precisão da informação. O modelo suporta até 258.048 tokens de entrada e gera até 32.768 tokens de saída. O preço é de 2.151 dólares por milhão de tokens de entrada e 8.602 dólares por token de saída, mas atualmente não suporta funcionalidades de processamento de imagem.
【Resumo da AiBase:】
🌟 O Qwen3-Max-Preview é um modelo de linguagem recém-lançado pela Alibaba, com mais de um trilhão de parâmetros.
💬 O modelo demonstra desempenho significativamente superior ao modelo anterior em compreensão de conhecimento, capacidade de diálogo e processamento de tarefas.
💰 O preço é de 2.151 dólares por milhão de tokens de entrada e 8.602 dólares por token de saída, sem suporte temporário a processamento de imagem.
Link detalhado: https://chat.qwen.ai/
3. Óculos de IA da Xiaomi lançam função de pagamento 'Olhe e Pague' no Alipay, tornando o pagamento um padrão dos óculos inteligentes
Os óculos de IA da Xiaomi lançaram oficialmente a função de pagamento "Olhe e Pague" do Alipay, permitindo que os usuários realizem pagamentos por meio de comandos de voz, aumentando a conveniência e a segurança do pagamento. Essa função foi desenvolvida em parceria com o Alipay e combinada com o sistema de risco multivariado do Alipay, garantindo a segurança das transações.
【Resumo da AiBase:】
✨ Os óculos de IA da Xiaomi suportam a função de pagamento "Olhe e Pague" do Alipay, melhorando a conveniência do pagamento.
🔒 O sistema de risco multivariado do Alipay garante a segurança das transações e aumenta a confiança do usuário.
🚀 A função de pagamento tornou-se um padrão dos óculos inteligentes, impulsionando o desenvolvimento dos óculos de IA.
4. Modelo de 14B de parâmetros da Microsoft desafia modelos gigantes de 671B, a aprendizagem por reforço de agentes redefine a razão matemática da IA
O modelo rStar2-Agent da Microsoft Research obteve avanços significativos na área de raciocínio matemático da IA, graças à tecnologia de aprendizagem por reforço de agentes, superando modelos com maior número de parâmetros e demonstrando potencial eficiente e inovador.
【Resumo da AiBase:】
🧠 O modelo rStar2-Agent realiza raciocínio autônomo e verificação de código por meio de mecanismos de interação entre agentes, evitando efetivamente problemas acumulados de erros.
🚀 No teste de benchmark matemático, o desempenho do rStar2-Agent superou o modelo DeepSeek-R1 com maior número de parâmetros, demonstrando maior eficiência.
🔧 Utiliza algoritmos GRPO-RoC para lidar com ruído ambiental, melhorando o efeito do treinamento e mostrando bom desempenho em várias tarefas, provando as vantagens da aprendizagem por reforço de agentes.
Detalhes: https://github.com/microsoft/rStar
5. MiniMax inicia emissão de opções adicionais: incentivo abrange funcionários-chave de toda a sequência
A MiniMax iniciou um novo plano de emissão adicional de opções, visando incentivar seus funcionários-chave. O plano abrange funcionários-chave de toda a sequência, incluindo algoritmos, engenharia, produto, mercado, crescimento e funções, indicando que a empresa valoriza não apenas a equipe de pesquisa e desenvolvimento, mas também reconhece altamente contribuições em áreas de negócios, mercado e operações.
【Resumo da AiBase:】
🌟 A MiniMax iniciou um plano de emissão adicional de opções para incentivar funcionários-chave de toda a sequência.
💡 A empresa enfatiza a importância de pesquisa e desenvolvimento, bem como áreas como negócios, mercado e operações.
🚀 Por meio de incentivos com opções, atrai e retém talentos顶尖, estabelecendo uma base para o futuro.
6. Microsoft lança novo modelo de agente de IA rStar2-Agent, desafiando modelos grandes com 14 bilhões de parâmetros
O modelo rStar2-Agent da Microsoft obteve avanços significativos na área de IA, mostrando desempenho excelente em vários benchmarks com 14 bilhões de parâmetros, superando até modelos maiores. O modelo demonstra uma nova forma de pensar sobre a relação entre desempenho do modelo e tamanho de parâmetros, por meio de métodos de treinamento inovadores e infraestrutura eficiente.
【Resumo da AiBase:】
🧠 O modelo rStar2-Agent possui apenas 14 bilhões de parâmetros, mas atingiu uma taxa de precisão de 80,6% em testes de raciocínio matemático, superando o DeepSeek-R1 com 671 bilhões de parâmetros.
🔧 A Microsoft inovou em infraestrutura, algoritmos e fluxo de treinamento, garantindo o treinamento eficiente e o desempenho excelente do modelo.
📊 O rStar2-Agent se destacou nas tarefas de raciocínio científico e uso de ferramentas, demonstrando uma forte capacidade de generalização.
Detalhes: https://github.com/microsoft/rStar
7. Google publica oficialmente limites de uso do Gemini: usuários gratuitos podem usar até cinco sugestões por dia
A Google esclareceu os limites de uso do Gemini por meio de um novo artigo no centro de ajuda, permitindo que os usuários entendam melhor os direitos de diferentes tipos de contas. Os usuários gratuitos podem usar até cinco sugestões por dia, enquanto os usuários Pro e Ultra têm 100 e 500 sugestões respectivamente. Além disso, os usuários gratuitos estão limitados no número de relatórios de pesquisa profunda e imagens geradas.
【Resumo da AiBase:】
🌟 Os usuários gratuitos podem usar até cinco sugestões por dia.
📊 Os usuários Pro podem usar até 100 sugestões por dia.
🔍 Após a atualização, você poderá desfrutar de mais benefícios, como gerar mais imagens e relatórios.
8. Xangai anuncia políticas de apoio à propaganda com IA: subsídio máximo de 5 milhões de yuans para modelos grandes
O governo de Xangai recentemente lançou "Medidas sobre o Apoio ao Desenvolvimento Inovador da Indústria de Publicidade por Meio da Inteligência Artificial", visando promover profundamente a aplicação e o desenvolvimento da tecnologia de IA na indústria de publicidade por meio de uma série de políticas específicas. As medidas centrais de apoio incluem subsídios para implantação privada de modelos grandes, subsídios para pesquisa e aplicação de dados de linguagem e suporte para aluguel de capacidade computacional. Essas políticas ajudarão a reduzir os custos de pesquisa e implementação de empresas, estimular a inovação do mercado e impulsionar a transformação digital e inteligente da indústria de publicidade.
【Resumo da AiBase:】
🧠 Subsídio para implantação privada de modelos grandes: Empresas de publicidade digital que adotarem modelos grandes de terceiros para implantação privada e os utilizarem na área vertical de publicidade receberão subsídios de até 50% do valor do contrato aprovado, com um máximo de 5 milhões de yuans.
📚 Subsídio para pesquisa e aplicação de dados de linguagem: Encorajando empresas a comprar dados de linguagem de partes não relacionadas para aplicação vertical de publicidade e pesquisa de "agente". Para esses investimentos, as empresas poderão receber subsídios de até 30% do valor do contrato aprovado, com um máximo de 5 milhões de yuans.
💻 Suporte para aluguel de capacidade computacional: Governos locais com condições também apoiarão empresas que aluguem capacidade computacional, fornecendo até 30% do investimento real, com um limite máximo de 20 milhões de yuans por entidade por ano.