MiniMax-M1-80k, le premier modèle de raisonnement hybride massivement ouvert source basé sur l'attention arrive sur Global Flow

AIbase基地

Publié leActualités IA · 5 minutes de lecture · Jun 17, 2025

5

Le modèle de raisonnement hybride de grande taille open source, MiniMax-M1-80k (456B), a été officiellement lancé par SiliconCloud (Flux en silicium). Cette innovation vise à fournir un soutien puissant pour des tâches complexes telles que l'ingénierie logicielle, la compréhension du contexte long et l'utilisation d'outils, et rivalise en performance avec des modèles de pointe comme o3 et Claude4Opus.

On sait que MiniMax-M1-80k peut supporter une longueur de contexte maximale de 128K, ce qui facilite grandement le traitement de textes longs. Pour les utilisateurs ayant des besoins spécifiques, la plateforme offre également un support en arrière-plan pour des contextes allant jusqu'à 1 million de tokens. Le prix d'utilisation de ce modèle est de ¥4 pour un million de Tokens en entrée et ¥16 pour un million de Tokens en sortie. Les nouveaux utilisateurs bénéficient également d'un crédit d'essai de 14 yuans lors de leur première utilisation.

Le modèle MiniMax-M1-80k a été développé sur la base de MiniMax-Text-01, en adoptant une architecture de système d'experts mixtes (MoE) et un mécanisme d'attention Lightning. Il dispose d'un cadre efficace d'extension par apprentissage par renforcement. Cette conception permet au modèle de s'adapter non seulement aux tâches de raisonnement mathématique traditionnelles, mais aussi d'intervenir dans des environnements réels de développement logiciel. Cela en fait un choix idéal pour les tâches nécessitant le traitement de texte long et une réflexion approfondie.

En termes de performances, les tests de référence de MiniMax montrent que le modèle consomme seulement 25% des FLOPs nécessaires pour générer 100 000 Tokens par rapport à DeepSeek R1, ce qui illustre son efficacité dans l'extension de la puissance de calcul. Par ailleurs, MiniMax-M1-80k obtient des résultats comparables à ceux de modèles de pointe comme o3 dans les domaines des mathématiques, du codage, de l’utilisation d’outils et de la compréhension du contexte long.

SiliconCloud, en tant que plateforme de services cloud unifiée pour les modèles de grande taille, s'efforce de fournir des services de qualité aux développeurs. Outre MiniMax-M1-80k, elle propose également plusieurs modèles excellents, tels que DeepSeek-R1-0528, Qwen3 et la série GLM-4, offrant ainsi une large gamme d'options aux développeurs. En particulier, des versions distillées de DeepSeek-R1 et d'autres modèles sont disponibles gratuitement, permettant aux développeurs d'accéder aux ressources sans restriction de Tokens.

Pour tester le nouveau MiniMax-M1-80k, les utilisateurs peuvent accéder à l'expérience en ligne et intégrer la plateforme via le site officiel de SiliconCloud, contribuant ainsi au développement des applications génératives IA.

Expérience en ligne

https://cloud.siliconflow.cn/models

Tutoriel pour l'intégration dans les applications tierces

https://docs.siliconflow.cn/cn/usercases/

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

MiniMax-M1-80k, le premier modèle de raisonnement hybride massivement ouvert source basé sur l'attention arrive sur Global Flow

AIbase基地

Cet article provient d'AIbase Daily