Récemment, l'entreprise de l'IA de Shanghai MiniMax a officiellement lancé le premier modèle de raisonnement à architecture hybride à grande échelle open source au monde - MiniMax-M1. Dès sa sortie, ce modèle a rapidement atteint les classements d'évaluation autorisés et est devenu le deuxième modèle open source du monde, juste derrière DeepSeek-R1-0528 récemment publié. Cette réalisation historique a fait dire à Yan Junjie, fondateur et PDG de MiniMax, sur les réseaux sociaux : « Pour la première fois, j'ai senti que les montagnes ne sont pas impossibles à franchir. »
La présentation de MiniMax-M1 n'est pas seulement remarquable, mais ses performances en termes de détails techniques sont également excellentes. Ce modèle montre un avantage important dans le traitement des textes longs et l'utilisation d'outils, avec une capacité d'entrée de contexte allant jusqu'à 1 million de tokens, suffisante pour traiter entièrement le roman anglais original « La Trilogie des Trois Corps ». Cette performance est huit fois supérieure à celle du modèle équivalent de DeepSeek, et peut même rivaliser avec le dernier modèle fermé de Google, Gemini2.5Pro.
Ce qui est encore plus impressionnant, c'est que MiniMax n'a investi que 535 000 dollars américains dans la recherche et le développement lors de la phase d'apprentissage par renforcement, bien inférieur aux coûts de recherche et développement généralement élevés à plusieurs millions de dollars dans l'industrie, démontrant ainsi son excellence en termes d'efficacité de recherche et de capacité de commercialisation. Dans les quatre jours ouvrables suivant la sortie de M1, MiniMax a rapidement lancé plusieurs produits innovants, notamment le modèle de génération vidéo Hailuo02, l'intelligent général MiniMax Agent, l'intelligent de création vidéo Hailuo Video Agent et l'outil de conception de voix Voice Design, maintenant un rythme remarquable de « mise à jour quotidienne ».
En tant qu'entreprise d'IA ancrée dans le district de Xuhui à Shanghai, MiniMax a commencé à s'implanter dans le domaine de l'intelligence artificielle générale (AGI) avant la vague mondiale causée par ChatGPT à la fin de 2022, et a résolument abandonné l'architecture dense des grands modèles et les mécanismes d'attention traditionnels qui étaient alors à la mode. Face à la contraction générale des entreprises de recherche sur les grands modèles mondiaux, MiniMax a fermement maintenu sa stratégie de recherche fondamentale, aboutissant finalement à cette percée technologique.
On peut dire que le lancement de MiniMax-M1 représente non seulement un grand pas en avant technologique, mais aussi une poussée importante pour l'avenir de l'industrie, et pourrait redéfinir la direction du développement des modèles d'IA open source.