Novo modelo aberto da Alibaba Qwen3-Next-80B-A3B com melhorias em desempenho e eficiência!

AIbase基地

Publicado emNotícias e Informações de IA · 5 minutos de leitura · Sep 12, 2025

A Alibaba lançou recentemente seu novo modelo de arquitetura Qwen3-Next-80B-A3B, marcando um importante avanço na área de conteúdo gerado por inteligência artificial (AIGC). O modelo inovou em mecanismos de atenção híbridos, modelos de especialistas de alta raridade (MoE) e métodos de treinamento, demonstrando melhorias significativas no desempenho.

O Qwen3-Next possui um total de 80 bilhões de parâmetros, mas ativa apenas 30 bilhões durante a inferência, reduzindo o custo de treinamento em 90% em comparação com seu antecessor Qwen3-32B. Além disso, sua eficiência de inferência foi aumentada 10 vezes, especialmente em textos muito longos (acima de 32K). Isso permite que o Qwen3-Next seja comparável ou até mesmo supere o modelo principal da Alibaba, Qwen3-235B, especialmente em tarefas de execução de instruções e processamento de contexto longo, superando até mesmo o novo modelo de pensamento Gemini-2.5-Flash da Google.

A inovação central do modelo está na arquitetura de especialistas híbridos, combinando DeltaNet controlado por portas e atenção controlada por portas. Com esse design, o Qwen3-Next superou as limitações dos mecanismos de atenção tradicionais no tratamento de contextos longos, garantindo velocidade e melhorando a capacidade de aprendizado contextual. Durante o treinamento, o modelo utilizou uma estrutura MoE de alta raridade, maximizando o uso de recursos sem afetar o desempenho.

Além disso, o Qwen3-Next introduziu um mecanismo de previsão de múltiplos tokens, melhorando o desempenho do modelo em decodificação especulativa. Na fase de pré-treinamento, a eficiência do Qwen3-Next foi significativamente maior do que a do Qwen3-32B, com custo de treinamento apenas 9,3% do anterior, mas com desempenho superior. Em termos de velocidade de inferência, o Qwen3-Next teve um aumento de 7 vezes na taxa de throughput ao lidar com textos longos em comparação com o Qwen3-32B, mantendo uma vantagem de 10 vezes mesmo em contextos ainda mais longos.

O novo modelo da Alibaba não apenas alcançou avanços tecnológicos, mas também recebeu amplo reconhecimento e elogios, especialmente entre desenvolvedores e pesquisadores. Seja em inovação tecnológica ou competitividade no mercado, o Qwen3-Next marca uma nova liderança da Alibaba na área de inteligência artificial.

Experimente online: https://chat.qwen.ai/

Endereço do código aberto: https://huggingface.co/collections/Qwen/qwen3-next-68c25fd6838e585db8eeea9d

Principais pontos:
🌟 O modelo Qwen3-Next-80B-A3B tem 80 bilhões de parâmetros, o custo de treinamento caiu 90% e a eficiência de inferência subiu 10 vezes.
🔍 O novo modelo adota uma arquitetura de especialistas híbridos e um mecanismo de previsão de múltiplos tokens, melhorando significativamente a capacidade de processamento de contexto.
🚀 Em termos de velocidade de inferência, o Qwen3-Next se destaca em cenários de textos muito longos, com taxa de throughput 7 a 10 vezes maior do que o modelo anterior.

Qwen3-LiveTranslate-Flash quebra o recorde da indústria com 3 segundos de latência na tradução em tempo real

A Qwen3-LiveTranslate-Flash é lançada como um sistema de tradução de áudio e vídeo em tempo real em múltiplos idiomas, suportando tradução offline e em tempo real para 18 idiomas principais e vários dialetos. A inovação central é a tecnologia de reforço do contexto visual, que não only escuta o áudio, mas também combina informações visuais para melhorar a precisão da tradução, trazendo avanços significativos para a comunicação multilíngue.

Cientista de elite da Stanford, Xu Zuhong, se junta à Tongyi da Alibaba

O especialista em IA global Xu Zuhong se juntou à equipe Tongyi da Alibaba, responsável pelo desenvolvimento do modelo de interação multimodal, gerando atenção no mundo da tecnologia. Como Fellow da IEEE, ele tem mais de 20 anos de experiência em IA e já atuou como professor titular na Universidade de Gestão de Singapura e professor associado na Universidade Tecnológica Nanyang. Essa ação é vista como uma importante estratégia de posicionamento da Alibaba no campo da IA.

O Alibaba Cloud lança o primeiro modelo de linguagem de 1 trilhão de parâmetros globalmente aberto, Ring-1T-preview, com capacidade de geração de código que supera o GPT-5

A Alibaba Cloud lançou o modelo de raciocínio de 1 trilhão de parâmetros Ring-1T-preview, o primeiro modelo de raciocínio de 1 trilhão de parâmetros aberto no mundo. A versão de pré-lançamento obteve destaque na performance de raciocínio em linguagem natural, obtendo 92,6 pontos no teste AIME25, superando todos os modelos abertos conhecidos, como o Gemini 2.5 Pro, e se aproximando dos 94,6 pontos do GPT-5; também teve desempenho excelente no teste CodeForces.

Tencent lança oficialmente o HUNYUAN Imagem 3.0, abrindo uma nova era na geração de imagens multimodais

O modelo de geração de imagens multimodais nativo open source HUNYUAN Imagem 3.0 da Tencent possui escala de parâmetros de 80B e realizou avanços tecnológicos. Como o primeiro modelo industrial de geração de imagens multimodais open source, seu desempenho rivaliza com modelos fechados de topo. O modelo possui forte capacidade de raciocínio, podendo compreender linguagem de mil caracteres e gerar imagens de alta qualidade.

Tencent lança e abre o código-fonte da nova modelo de geração de imagens HunyuanImage 3.0

O Tencent lançou o modelo de geração de imagens multimodais 'Hunyuan Image 3.0' de código aberto, com 80B de parâmetros, sendo o primeiro modelo industrial nativo multimodal. Oferece resultados comparáveis a modelos proprietários, destacando-se na interpretação de textos complexos e geração de imagens correspondentes.....

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Novo modelo aberto da Alibaba Qwen3-Next-80B-A3B com melhorias em desempenho e eficiência!

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

Qwen3-LiveTranslate-Flash quebra o recorde da indústria com 3 segundos de latência na tradução em tempo real

Cientista de elite da Stanford, Xu Zuhong, se junta à Tongyi da Alibaba

O Alibaba Cloud lança o primeiro modelo de linguagem de 1 trilhão de parâmetros globalmente aberto, Ring-1T-preview, com capacidade de geração de código que supera o GPT-5

Anthropic lança Claude Sonnet 4.5: capacidade de codificação lidera a lista, recurso experimental Imagine apresenta uma prévia da era da interface nativa de IA

Sete modelos da Alibaba Tongyi dominam o Hugging Face! Modelo multimodal Qwen3-Omni fica em primeiro lugar no mundo

Ecovacs e Alibaba Cloud se unem, os robôs de aspiração entram na era da inteligência

A Alibaba Cloud lança o novo amigo de segurança Qwen3Guard, visando fornecer uma proteção segura para a inteligência artificial

Tencent lança oficialmente o HUNYUAN Imagem 3.0, abrindo uma nova era na geração de imagens multimodais

Tencent lança e abre o código-fonte da nova modelo de geração de imagens HunyuanImage 3.0

Apple lança novo modelo de imagem Manzano com capacidade dupla de compreensão e geração

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Novo modelo aberto da Alibaba Qwen3-Next-80B-A3B com melhorias em desempenho e eficiência!

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

Qwen3-LiveTranslate-Flash quebra o recorde da indústria com 3 segundos de latência na tradução em tempo real

Cientista de elite da Stanford, Xu Zuhong, se junta à Tongyi da Alibaba

O Alibaba Cloud lança o primeiro modelo de linguagem de 1 trilhão de parâmetros globalmente aberto, Ring-1T-preview, com capacidade de geração de código que supera o GPT-5

Anthropic lança Claude Sonnet 4.5: capacidade de codificação lidera a lista, recurso experimental Imagine apresenta uma prévia da era da interface nativa de IA

Sete modelos da Alibaba Tongyi dominam o Hugging Face! Modelo multimodal Qwen3-Omni fica em primeiro lugar no mundo

Ecovacs e Alibaba Cloud se unem, os robôs de aspiração entram na era da inteligência

A Alibaba Cloud lança o novo amigo de segurança Qwen3Guard, visando fornecer uma proteção segura para a inteligência artificial

Tencent lança oficialmente o HUNYUAN Imagem 3.0, abrindo uma nova era na geração de imagens multimodais

Tencent lança e abre o código-fonte da nova modelo de geração de imagens HunyuanImage 3.0

Apple lança novo modelo de imagem Manzano com capacidade dupla de compreensão e geração

GEO Services