Récemment, Meituan a annoncé le lancement d'un grand modèle de raisonnement basé sur une architecture Mixture of Experts (MoE) : LongCat-Flash-Thinking. Ce nouveau modèle compte jusqu'à 56 milliards de paramètres, ce qui est impressionnant ! Mais la surprise la plus grande est qu'il peut activer dynamiquement entre 18,6 et 31,3 milliards de paramètres selon le contexte, avec une moyenne d'environ 27 milliards de paramètres activés. Cette conception flexible permet au modèle de se distinguer dans diverses tâches, en particulier dans les domaines du raisonnement logique, des opérations mathématiques et de la programmation.
Selon les données officielles de Meituan, LongCat-Flash-Thinking a été comparé en profondeur à d'autres modèles majeurs sur une série de tests de référence. Dans le domaine du raisonnement mathématique, par exemple, lors des tests MATH500 et AIME25, ce modèle s'est montré remarquable, affirmant même qu'en utilisant des outils natifs, il réduit de 64,5 % la consommation de tokens tout en atteignant un taux d'exactitude de haut niveau. De plus, dans les domaines du raisonnement général (GPQA-Diamond), de la génération de code (LiveCodeBench, OJBench) et de la preuve formelle de théorèmes (MiniF2F-Test), ses performances sont également proches du niveau de pointe de l'industrie.
Les poids du modèle LongCat-Flash-Thinking sont maintenant disponibles sous licence MIT, permettant aux développeurs d'utiliser librement et d'étudier cet outil puissant. Le site officiel propose également un modèle détaillé de conversation et a mis en ligne un site dédié à la conversation, facilitant ainsi les interactions et les expériences des utilisateurs.
LongCat-Flash-Thinking n’est pas seulement un grand modèle d’IA, mais c’est aussi une importante tentative de Meituan dans le domaine de la recherche en intelligence artificielle. Ses performances exceptionnelles et son architecture flexible offriront de nouvelles possibilités pour le développement d’applications et la recherche future.
Adresse du site officiel : https://longcat.chat/