A SiliconCloud lançou globalmente o primeiro modelo de inferência híbrido de atenção em larga escala de código aberto — MiniMax-M1-80k (456B). Este modelo inovador foi projetado para oferecer suporte robusto a tarefas complexas como engenharia de software, compreensão de contexto longo e uso de ferramentas, com desempenho comparável aos principais modelos atuais, como o o3 e o Claude4Opus.

image.png

Segundo os relatórios, o MiniMax-M1-80k pode suportar até 128K de comprimento de contexto, o que facilita muito o processamento de textos longos. Para usuários com necessidades específicas, a plataforma também oferece suporte ao contexto longo de até 1M. O preço do modelo é de ¥4 por milhão de Tokens para entrada e ¥16 por milhão de Tokens para saída. Novos usuários recebem um crédito de experiência de 14 yuans na primeira utilização.

image.png

O modelo MiniMax-M1-80k foi desenvolvido com base no MiniMax-Text-01, utilizando uma arquitetura de sistema de especialistas mistos (MoE) e o mecanismo de Attenção Lightning, com um eficiente framework de aprendizado por reforço. Essa configuração permite que o modelo não apenas execute tarefas tradicionais de推理 matemático, mas também funcione em ambientes de desenvolvimento de software realista. Portanto, ele se tornou uma escolha ideal para tarefas que exigem processamento de texto longo e pensamento profundo.

No quesito desempenho, os testes de referência mostram que o MiniMax consome apenas 25% dos FLOPs necessários para gerar 100 mil Tokens em comparação ao DeepSeek R1, indicando uma eficiência extrema na expansão da capacidade de inferência. Além disso, o MiniMax-M1-80k apresenta resultados semelhantes aos principais modelos como o o3 em áreas como matemática, programação, uso de ferramentas e compreensão de contexto longo.

A SiliconCloud, como uma plataforma de serviços em nuvem de modelos grandes unificada, se dedica a fornecer serviços de alta qualidade para desenvolvedores. Além do MiniMax-M1-80k, a plataforma lançou várias outras ótimas opções, como o DeepSeek-R1-0528, Qwen3, GLM-4 series etc., enriquecendo as escolhas dos desenvolvedores. Em particular, versões distiladas do DeepSeek-R1 e outros vários modelos podem ser usados gratuitamente, ajudando os desenvolvedores a alcançar a "liberdade de Token".

Para experimentar o MiniMax-M1-80k recém-lançado, os usuários podem acessar a página oficial da SiliconCloud para experiência online e integração, promovendo ainda mais o desenvolvimento das aplicações de IA gerativa.

Experimente online

https://cloud.siliconflow.cn/models

Tutorial de integração de aplicativos terceirizados

https://docs.siliconflow.cn/cn/usercases/