Diário de IA: Microsoft lança seu primeiro modelo de geração de imagens desenvolvido internamente MAI-Image-1; data do evento Mundial da Baidu divulgada; especialistas em IA abrem o ferramenta de ensino nanochat

Bem-vindo ao programa "AI Daily"! Aqui é o seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os conteúdos mais quentes do setor de IA, focando nos desenvolvedores e ajudando você a compreender as tendências tecnológicas e conhecer aplicações inovadoras de produtos de IA.

Produtos de IA novos clicar para obter mais informações:https://app.aibase.com/zh

1. Microsoft lança seu primeiro modelo de geração de imagens desenvolvido internamente, MAI-Image-1, entrando no top 10 do LMArena

A Microsoft AI apresentou oficialmente seu primeiro modelo de geração de imagens totalmente desenvolvido internamente, o MAI-Image-1, que está no top 10 do LMArena, demonstrando uma capacidade notável de geração de imagens. O MAI-Image-1 enfatiza o valor prático, evitando imagens repetidas ou com estilos monótonos. Além disso, destaca-se em efeitos de luz e paisagens naturais, combinando velocidade e qualidade para melhorar a eficiência criativa. A equipe da Microsoft também testou o modelo no LMArena para garantir uso seguro e planeja aplicá-lo no Copilot e no Bing Image Creator, oferecendo ferramentas de criação mais poderosas aos usuários.

【Resumo do AiBase:】
🌟 Primeiro modelo desenvolvido internamente: o MAI-Image-1 é o primeiro modelo de geração de imagens desenvolvido internamente pela Microsoft AI.
⚡ Alta qualidade e rápida iteração: o modelo se destaca na geração de imagens realistas, combinando velocidade e qualidade para melhorar a eficiência criativa.
🛡️ Aplicação segura e responsável: a equipe da Microsoft testou o modelo no LMArena para garantir uso seguro e espera lançá-lo em mais plataformas.
Link detalhado: https://microsoft.ai/news/introducing-mai-image-1-debuting-in-the-top-10-on-lmarena/

2. Baidu World 2025 será realizado em 13 de novembro: foco em tecnologias de modelos grandes, aplicações nativas de IA e estratégias globais

O evento Baidu World 2025 se concentra em tecnologias de modelos grandes, aplicações nativas de IA e estratégias globais, mostrando as vantagens tecnológicas e o plano futuro da Baidu no setor de inteligência artificial.

【Resumo do AiBase:】
🧠 A Baidu mostrará seus avanços mais recentes e acumulação técnica no campo de modelos grandes.
💡 Focar no desenvolvimento da ecologia de aplicações nativas de IA, impulsionando a transformação digital.
🌍 Mostrar a estratégia global da Baidu, explorando potencial de crescimento no mercado internacional.

3. Laboratório de Inteligência Supergrande da Meta lança nova tecnologia, aumentando a velocidade de raciocínio de modelos grandes em 30 vezes

A empresa Meta criou um novo Laboratório de Inteligência Supergrande (MSL) e publicou sua primeira importante pesquisa intitulada "REFRAG: Rethinking RAG based Decoding", aumentando significativamente a velocidade de raciocínio dos modelos de linguagem grande nas tarefas de geração baseada em recuperação (RAG), com um aumento superior a 30 vezes. Estudos mostram que, por meio de métodos de compressão de informação e pré-treinamento contínuo, a eficiência e precisão do modelo foram melhoradas, injetando nova vitalidade no desenvolvimento da área de inteligência artificial.

【Resumo do AiBase:】
🧠 A Meta fundou um laboratório de inteligência supergrande, promovendo o desenvolvimento de tecnologias de IA.
⚡ O artigo "REFRAG" alcançou um aumento de 30 vezes na velocidade de raciocínio RAG, reduzindo o consumo de cálculo.
🚀 O framework REFRAG melhora a eficiência e a precisão dos modelos de linguagem grande por meio da compressão de informações.
Detalhes: https://arxiv.org/abs/2509.01092

4. Construa seu próprio ChatGPT por 100 dólares: especialista em IA abre nanochat, construa um robô de conversa em 4 horas

O nanochat é um novo projeto aberto que permite que desenvolvedores comuns e entusiastas de IA construam sistemas de IA de chat completos com custo mínimo. O projeto implementa um fluxo de trabalho simplificado desde o processamento de dados até a implantação, reduzindo significativamente a barreira tecnológica.

【Resumo do AiBase:】
🔥 O nanochat fornece uma ferramenta completa para ensinar os usuários a compreender profundamente o processo de treinamento de modelos de linguagem grandes.
💡 O projeto abrange etapas como treinamento do modelo, fine-tuning, avaliação e implantação interativa, suportando carregamento eficiente distribuído.
🚀 Os usuários podem iniciar apenas um nó de nuvem e executar um único script para completar todo o processo em 4 horas.
Detalhes: https://github.com/karpathy/nanochat

5. Google NotebookLM lança função de vídeo em estilo anime: Nano Banana gera seis estilos artísticos com um clique, suporte ao chinês ainda precisa de otimização

O recurso de vídeo em estilo anime foi adicionado à ferramenta NotebookLM da Google, usando o modelo de geração de imagens Nano Banana, permitindo que os usuários convertam documentos em vídeos dinâmicos e escolham vários estilos artísticos. Apesar da força funcional, o suporte ao chinês ainda tem deficiências, como confusão de dialetos e problemas de sincronização.

【Resumo do AiBase:】
✨ O NotebookLM da Google adicionou a função de vídeo em estilo anime, aumentando a criatividade no conteúdo.
🎨 Suporta seis estilos artísticos, incluindo aquarela, impressão antiga e estilo animado japonês.
⚠️ O suporte ao chinês tem problemas de processamento de linguagem, precisando de otimização adicional para atender a ambientes multilíngues.

6. Universidade Agrícola da China lança o Modelo Shen Nong 3.0, IA apoia a revitalização rural

A Universidade Agrícola da China lançou o Modelo Shen Nong 3.0 durante a Conferência Mundial de Inovação Tecnológica Agrícola 2025. O modelo cobre disciplinas agrícolas nacionais e cenários de aplicação, marcando uma nova fase no desenvolvimento da tecnologia de IA agrícola da China. O Modelo Shen Nong 3.0, ao lançar versões de 32B, 7B e 1B, melhorou significativamente a eficiência computacional e reduziu a capacidade de cálculo em 50%. Além disso, a equipe também lançou a "Plataforma de Agentes do Modelo Shen Nong", construindo um novo ecossistema de aplicações de IA, impulsionando ainda mais o desenvolvimento da tecnologia de IA agrícola para um "inteligência sistêmica" mais alto.

【Resumo do AiBase:】
🌱 O Modelo Shen Nong 3.0 cobre disciplinas agrícolas nacionais e cenários de aplicação, marcando uma nova fase no desenvolvimento da tecnologia de IA agrícola da China.
🚀 O Modelo Shen Nong 3.0 lança versões de 32B, 7B e 1B, melhorando a eficiência computacional e reduzindo a capacidade de cálculo em 50%.
🌍 A equipe da Universidade Agrícola da China lançou a "Plataforma de Agentes do Modelo Shen Nong", construindo um novo ecossistema de aplicações de IA.

7. Tencent se concentra na formação de talentos em IA: bolsa Qingyun financia 15 estudantes de mestrado e doutorado, fornecendo recursos raros de cálculo

A empresa Tencent anunciou o lançamento da "Bolsa Qingyun", que se concentra em pesquisas fundamentais e inovações aplicadas na área de inteligência artificial, visando apoiar estudantes de mestrado e doutorado notáveis nas áreas de ciência da computação, inteligência artificial e suas interseções. O primeiro ciclo prevê selecionar 15 vencedores, cada um recebendo 500 mil yuans em dinheiro e recursos de cálculo para resolver problemas de gargalo de cálculo na pesquisa. Essa bolsa é uma parte importante do plano de talentos da Tencent, aprimorando ainda mais seu sistema de formação multidimensional.

【Resumo do AiBase:】
🧠 A bolsa "Qingyun" da Tencent se concentra na área de inteligência artificial, apoiando o trabalho de pesquisa dos estudantes de mestrado e doutorado.
💰 O primeiro ciclo financia 15 vencedores, cada um recebendo 500 mil yuans em dinheiro e recursos de cálculo.
🚀 A bolsa visa aprimorar o sistema de formação de talentos da Tencent, fornecendo oportunidades de orientação de mentores e visitas a laboratórios.

8. Apple lança novo modelo FS-DFM, eficiência de escrita de texto longo aumenta 128 vezes!

O modelo FS-DFM, lançado pela Apple em colaboração com uma equipe de pesquisa da Universidade Estadual de Ohio, mostra excelente desempenho na geração de textos longos, podendo gerar texto de alta qualidade em apenas 8 iterações rápidas, aumentando a velocidade de entrada em até 128 vezes, rompendo a limitação de eficiência anterior na geração de textos longos. O modelo otimizou o mecanismo de iteração com um método de três etapas, tornando-o superior a outros grandes modelos nas métricas-chave como perplexidade e entropia, demonstrando seu potencial na área de escrita de textos longos de IA.

【Resumo do AiBase:】
🍎 O modelo FS-DFM pode gerar qualidade equivalente a 1000 iterações tradicionais com apenas 8 iterações.
🚀 A velocidade de entrada aumenta até 128 vezes, aumentando significativamente a eficiência da geração de textos longos.
🔍 Testes de desempenho mostram que o FS-DFM supera outros grandes modelos nas métricas-chave de perplexidade e entropia.
Detalhes: https://machinelearning.apple.com/research/fs-dfm

9. Google Lens e modo de IA lançam função de edição de imagem Nano Banana

A Google lançou oficialmente a função de edição de imagem Nano Banana, obtendo boa resposta no aplicativo Gemini. Essa função foi integrada ao modo de IA e ao Google Lens, permitindo que os usuários editem e gerem imagens de forma mais conveniente. Atualmente, essa função foi lançada para usuários Android e iOS nos Estados Unidos e Índia e planeja expandir-se para mais países e regiões.

【Resumo do AiBase:】
📱 O modo de IA e o Google Lens foram integrados, melhorando a experiência de captura e edição de imagens.
🌍 Novo suporte a 35 idiomas e 40 países amplia a cobertura do modo de IA.
🎨 Os usuários podem criar ou editar imagens usando o emoji banana e ter a marca d'água do Gemini.

10. HKU e Meituan unem forças para resolver desafios matemáticos de IA: CodePlot-CoT faz com que modelos grandes aprendam a pensar com código gráfico, performance aumenta 21%

O artigo apresenta o método CodePlot-CoT proposto pelo grupo da Universidade de Hong Kong e da Meituan, que resolve dificuldades em problemas geométricos matemáticos fazendo com que os modelos grandes gerem código de plotagem. Essa abordagem transforma problemas de geração de imagens em problemas de modelagem linguística, melhorando o desempenho dos modelos grandes em raciocínio matemático.

【Resumo do AiBase:】
📌 O CodePlot-CoT resolve problemas matemáticos geométricos gerando código de plotagem, melhorando a capacidade de raciocínio.
💡 O conjunto de dados Math-VR exige que o modelo pense graficamente, impulsionando o desenvolvimento do raciocínio multimodal matemático.
📈 Os resultados experimentais mostram que o CodePlot-CoT aumenta o desempenho em até 21% no benchmark Math-VR.
Detalhes: https://arxiv.org/pdf/2510.11718

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Diário de IA: Microsoft lança seu primeiro modelo de geração de imagens desenvolvido internamente MAI-Image-1; data do evento Mundial da Baidu divulgada; especialistas em IA abrem o ferramenta de ensino nanochat

站长之家

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

A equipe de IA da Xiaomi se une à Pekin para publicar um novo artigo. A jovem gênio que o Lei Xun contratou com salário alto participou da pesquisa

Hospital Tsinghua Changgong e a Beijing Electronics & Digital Intelligence colaboram no desenvolvimento do primeiro modelo de grande porte em farmacologia nacional: foco na avaliação da segurança do uso de medicamentos em grupos populacionais especiais

A criação de música com IA se torna um trabalho complementar para programadores: o single ultrapassa 2 milhões de reproduções e a receita com direitos autorais chega a vários milhares de yuans

OpenAI suspende a geração de vídeo de Martin Luther King pela Sora para proteger a imagem de figuras históricas

Equipe de Li Feifei lança RTFM: geração em tempo real do mundo 3D com uma placa H100

Uma frase muda o potencial de criação da IA: estudo descobre que dicas simples podem aumentar significativamente a diversidade na saída

Chongqing reforça a regulamentação e remove mais de 10 produtos de IA irregulares para garantir a segurança da tecnologia

Diário de AI: Gemini 3.0 Pro da Google lançado em pequena escala; A Eshi Technology concluiu uma financiamento de 1 bilhão de yuans na série B+; a Baidu lançou o modelo de análise de documentos PaddleOCR-VL

Jornal AI: ByteDance lança modelo de grande dimensão Doubao 1.6; A Aishitech conclui uma rodada de financiamento B+ de 100 milhões de yuans; a Baidu lança o modelo de análise de documentos PaddleOCR-VL

A empresa de vídeo AI Aishitech concluiu uma rodada de financiamento B+ de 100 milhões de yuans: ARR ultrapassa 40 milhões de dólares e tem mais de 100 milhões de usuários

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Diário de IA: Microsoft lança seu primeiro modelo de geração de imagens desenvolvido internamente MAI-Image-1; data do evento Mundial da Baidu divulgada; especialistas em IA abrem o ferramenta de ensino nanochat

站长之家

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

A equipe de IA da Xiaomi se une à Pekin para publicar um novo artigo. A jovem gênio que o Lei Xun contratou com salário alto participou da pesquisa

Hospital Tsinghua Changgong e a Beijing Electronics & Digital Intelligence colaboram no desenvolvimento do primeiro modelo de grande porte em farmacologia nacional: foco na avaliação da segurança do uso de medicamentos em grupos populacionais especiais

A criação de música com IA se torna um trabalho complementar para programadores: o single ultrapassa 2 milhões de reproduções e a receita com direitos autorais chega a vários milhares de yuans

OpenAI suspende a geração de vídeo de Martin Luther King pela Sora para proteger a imagem de figuras históricas

Equipe de Li Feifei lança RTFM: geração em tempo real do mundo 3D com uma placa H100

Uma frase muda o potencial de criação da IA: estudo descobre que dicas simples podem aumentar significativamente a diversidade na saída

Chongqing reforça a regulamentação e remove mais de 10 produtos de IA irregulares para garantir a segurança da tecnologia

Diário de AI: Gemini 3.0 Pro da Google lançado em pequena escala; A Eshi Technology concluiu uma financiamento de 1 bilhão de yuans na série B+; a Baidu lançou o modelo de análise de documentos PaddleOCR-VL

Jornal AI: ByteDance lança modelo de grande dimensão Doubao 1.6; A Aishitech conclui uma rodada de financiamento B+ de 100 milhões de yuans; a Baidu lança o modelo de análise de documentos PaddleOCR-VL

A empresa de vídeo AI Aishitech concluiu uma rodada de financiamento B+ de 100 milhões de yuans: ARR ultrapassa 40 milhões de dólares e tem mais de 100 milhões de usuários

GEO Services