L'Université de Waterloo et d'autres institutions ont conjointement publié en open source MAmmoTH, un grand modèle linguistique spécialement conçu pour les problèmes mathématiques. MAmmoTH surpasse les modèles open source existants sur les ensembles de données de raisonnement mathématique, avec une amélioration de la précision moyenne de 12 % à 29 %. Plus précisément, le modèle MAmmoTH-7B atteint une précision de 35 % sur les ensembles de données de compétition, dépassant ainsi le meilleur modèle open source de 7B paramètres. Le modèle MAmmoTH-34B atteint une précision de 46 % sur l'ensemble de données MATH, surpassant même les résultats de GPT-4.
Les performances supérieures de MAmmoTH en font le nouveau leader dans le domaine du raisonnement mathématique.