MAmmoTH Open Source : 34 milliards de paramètres surpassant GPT-4, amélioration de 29 % de la précision moyenne du grand modèle mathématique généralisé

新智元

Publié leActualités IA · 2 minutes de lecture · Sep 19, 2023

MAmmoTH : Un nouveau modèle de pointe pour les problèmes mathématiques

L'Université de Waterloo et d'autres institutions ont conjointement publié en open source MAmmoTH, un grand modèle linguistique spécialement conçu pour les problèmes mathématiques. MAmmoTH surpasse les modèles open source existants sur les ensembles de données de raisonnement mathématique, avec une amélioration de la précision moyenne de 12 % à 29 %. Plus précisément, le modèle MAmmoTH-7B atteint une précision de 35 % sur les ensembles de données de compétition, dépassant ainsi le meilleur modèle open source de 7B paramètres. Le modèle MAmmoTH-34B atteint une précision de 46 % sur l'ensemble de données MATH, surpassant même les résultats de GPT-4.

Les performances supérieures de MAmmoTH en font le nouveau leader dans le domaine du raisonnement mathématique.

Grand modèle mathématique généralisé MAmmoTH GPT-4

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

Journal de l'IA : ByteDance lancera une version 2.0 de son outil de programmation par IA TRAE ; Mistral présente un modèle audio majeur, Voxtral ; Moonshot répond à la lenteur de l'API Kimi K2

1. ByteDance TRAE2.0 ajoute interaction vocale. 2. Mistral lance Voxtral, modèle audio open source multilingue. 3. Optimisation de Kimi K2API. 4. Kunlun publie AgentOrchestra. 5. Thinking Machines Lab lève 2Mds$. 6. Kimi-2 surpasse GPT-4.1. 7. TRAE propose Kimi-K2 et Grok-4. 8. ByteDance open source POLARIS. 9. ima accessible via navigateur.....

Jul 16, 2025

Kimi-2 est maintenant en ligne sur LiveBench AI : un nouveau roi des IA open source dépasse GPT-4.1

Kimi-2, modèle IA open-source avec 32B paramètres, surpasse Claude Opus4 et GPT-4.1. Tarif API compétitif à 0,15$/M tokens, intégré dans l'app Kimi.....

Jul 16, 2025

La dernière recette d'apprentissage par renforcement de Seed de ByteDance, POLARIS, est maintenant open source avec un modèle de 4 milliards de paramètres, capables de raisonnement mathématique proches des performances de 235 milliards de paramètres

Récemment, l'équipe Seed de ByteDance a collaboré avec l'Université de Hong Kong et l'Université Fudan pour présenter une nouvelle méthode d'entraînement par renforcement appelée POLARIS. Cette méthode, grâce à une stratégie d'apprentissage par renforcement bien conçue, a réussi à améliorer les capacités de raisonnement mathématique des petits modèles jusqu'au niveau des grands modèles. Cela offre une nouvelle voie pour l'optimisation des petits modèles dans le domaine de l'intelligence artificielle. Les résultats expérimentaux montrent que le modèle open source Qwen3-4B de 4 milliards de paramètres entraîné avec POLARIS obtient des performances proches des modèles de 235 milliards de paramètres aux tests mathématiques AIME25 et AIME24.

Jul 16, 2025

TRAE lance le service du modèle Kimi-K2, la version internationale prend en charge la fonction Grok-4 (Beta) mise à niveau

TRAE.ai lance Kimi-K2 (MoE) et Grok-4(Beta). Kimi-K2 excelle en code/maths, rivalisant avec GPT-4.1. Accès en 3 étapes. Version internationale propose aussi Claude, Gemini, GPT.....

Jul 16, 2025

Journal de l'IA : Meitu lance un agent d'images AI appelé RoboNeo ; le modèle K2 Kimi avec une quantification de 1,8 bit est disponible ; Amazon présente un éditeur de code IA Kiro

Jul 15, 2025

Unsloth AI lance le modèle Kimi K2 avec une quantification à 1,8 bit, réduisant significativement les coûts de déploiement

Unsloth AI a quantifié le modèle Kimi K2 de Moeshot AI en 1.8bit, réduisant sa taille de 1.1TB à 245GB (-80%) sans perte de performance. Ce modèle open source à 1 trillion de paramètres, basé sur l'architecture MoE, excelle en génération de code et raisonnement. Version quantifiée utilisable sur M3Ultra 512GB, réduisant les coûts de déploiement. Concurrence sérieuse pour GPT-4.1, favorisant l'IA open source pour PME.....

Jul 15, 2025

X (anciennement Twitter) annonce l'introduction d'une fonction de partenaire IA animée Grok, suscitant un grand intérêt

Tesla CEO Musk lance Grok, un chatbot avec des avatars animés comme Ani et Bad Rudy, réservé aux abonnés SuperGrok (30$/mois). Grok4 surpasserait ChatGPT, mais soulève des questions éthiques et de transparence.....

Jul 15, 2025

Amazon lance un éditeur de code AI Kiro qui utilise gratuitement Claude 4/3.7 Sonnet

AWS d'Amazon lance un nouvel outil de développement AI nommé Kiro, centré sur le concept de développement guidé par des normes. Cet outil repose sur la plateforme open source Code OSS, compatible avec l'écosystème VS Code, et génère d'abord des documents de spécifications et des conceptions système grâce à une collaboration AI, puis génère automatiquement du code, des cas de test et des documents pour garantir la qualité du code. Kiro prend en charge les entrées multimodales et des fonctions telles que les tests automatisés. Il est actuellement disponible en version gratuite, avec une version payante prévue à l'avenir. Ce mode de développement guidé par des normes pourrait résoudre les problèmes de maintenance liés aux codes générés par l'IA, bien que l'utilisation initiale puisse être complexe.

Jul 15, 2025

Une nouvelle incertitude dans la stratégie d'ouverture de Meta ? Des dirigeants discutent d'abandonner le modèle Behemoth pour se concentrer sur le développement fermé

Meta envisage d'abandonner l'IA open-source pour un modèle fermé, malgré ses démentis. Ce changement stratégique pourrait impacter l'écosystème mondial de l'IA.....

Jul 15, 2025

Der Wert beträgt mehr als 4 Milliarden Dollar – MiniMax erhält Unterstützung der staatlichen Kapitalien aus Shanghai und schließt sich dem Club der 300-Milliarden-Modell-Unternehmen an

MiniMax, société chinoise d'IA, a levé 300 millions USD, valorisée à 4 milliards USD. Soutenue par Shanghai et visant une IPO à Hong Kong.....

Jul 15, 2025

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

MAmmoTH Open Source : 34 milliards de paramètres surpassant GPT-4, amélioration de 29 % de la précision moyenne du grand modèle mathématique généralisé

新智元

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

Journal de l'IA : ByteDance lancera une version 2.0 de son outil de programmation par IA TRAE ; Mistral présente un modèle audio majeur, Voxtral ; Moonshot répond à la lenteur de l'API Kimi K2

Kimi-2 est maintenant en ligne sur LiveBench AI : un nouveau roi des IA open source dépasse GPT-4.1

La dernière recette d'apprentissage par renforcement de Seed de ByteDance, POLARIS, est maintenant open source avec un modèle de 4 milliards de paramètres, capables de raisonnement mathématique proches des performances de 235 milliards de paramètres

TRAE lance le service du modèle Kimi-K2, la version internationale prend en charge la fonction Grok-4 (Beta) mise à niveau

Journal de l'IA : Meitu lance un agent d'images AI appelé RoboNeo ; le modèle K2 Kimi avec une quantification de 1,8 bit est disponible ; Amazon présente un éditeur de code IA Kiro

Unsloth AI lance le modèle Kimi K2 avec une quantification à 1,8 bit, réduisant significativement les coûts de déploiement

X (anciennement Twitter) annonce l'introduction d'une fonction de partenaire IA animée Grok, suscitant un grand intérêt

Amazon lance un éditeur de code AI Kiro qui utilise gratuitement Claude 4/3.7 Sonnet

Une nouvelle incertitude dans la stratégie d'ouverture de Meta ? Des dirigeants discutent d'abandonner le modèle Behemoth pour se concentrer sur le développement fermé

Der Wert beträgt mehr als 4 Milliarden Dollar – MiniMax erhält Unterstützung der staatlichen Kapitalien aus Shanghai und schließt sich dem Club der 300-Milliarden-Modell-Unternehmen an