Le modèle de raisonnement hybride de grande taille open source, MiniMax-M1-80k (456B), a été officiellement lancé par SiliconCloud (Flux en silicium). Cette innovation vise à fournir un soutien puissant pour des tâches complexes telles que l'ingénierie logicielle, la compréhension du contexte long et l'utilisation d'outils, et rivalise en performance avec des modèles de pointe comme o3 et Claude4Opus.

image.png

On sait que MiniMax-M1-80k peut supporter une longueur de contexte maximale de 128K, ce qui facilite grandement le traitement de textes longs. Pour les utilisateurs ayant des besoins spécifiques, la plateforme offre également un support en arrière-plan pour des contextes allant jusqu'à 1 million de tokens. Le prix d'utilisation de ce modèle est de ¥4 pour un million de Tokens en entrée et ¥16 pour un million de Tokens en sortie. Les nouveaux utilisateurs bénéficient également d'un crédit d'essai de 14 yuans lors de leur première utilisation.

image.png

Le modèle MiniMax-M1-80k a été développé sur la base de MiniMax-Text-01, en adoptant une architecture de système d'experts mixtes (MoE) et un mécanisme d'attention Lightning. Il dispose d'un cadre efficace d'extension par apprentissage par renforcement. Cette conception permet au modèle de s'adapter non seulement aux tâches de raisonnement mathématique traditionnelles, mais aussi d'intervenir dans des environnements réels de développement logiciel. Cela en fait un choix idéal pour les tâches nécessitant le traitement de texte long et une réflexion approfondie.

En termes de performances, les tests de référence de MiniMax montrent que le modèle consomme seulement 25% des FLOPs nécessaires pour générer 100 000 Tokens par rapport à DeepSeek R1, ce qui illustre son efficacité dans l'extension de la puissance de calcul. Par ailleurs, MiniMax-M1-80k obtient des résultats comparables à ceux de modèles de pointe comme o3 dans les domaines des mathématiques, du codage, de l’utilisation d’outils et de la compréhension du contexte long.

SiliconCloud, en tant que plateforme de services cloud unifiée pour les modèles de grande taille, s'efforce de fournir des services de qualité aux développeurs. Outre MiniMax-M1-80k, elle propose également plusieurs modèles excellents, tels que DeepSeek-R1-0528, Qwen3 et la série GLM-4, offrant ainsi une large gamme d'options aux développeurs. En particulier, des versions distillées de DeepSeek-R1 et d'autres modèles sont disponibles gratuitement, permettant aux développeurs d'accéder aux ressources sans restriction de Tokens.

Pour tester le nouveau MiniMax-M1-80k, les utilisateurs peuvent accéder à l'expérience en ligne et intégrer la plateforme via le site officiel de SiliconCloud, contribuant ainsi au développement des applications génératives IA.

Expérience en ligne

https://cloud.siliconflow.cn/models

Tutoriel pour l'intégration dans les applications tierces

https://docs.siliconflow.cn/cn/usercases/