AlphaOne (α1) est un cadre général pour réguler les transitions de raisonnement des grands modèles inférentiels (LRMs) lors des tests. En introduisant les moments α et en ajustant dynamiquement les transitions de raisonnement lent, α1 permet une régulation flexible entre le raisonnement lent et rapide. Cette méthode unifie et étend les méthodes existantes de mise à l'échelle monotone, optimisant ainsi les capacités d'inférence et l'efficacité du calcul. Ce produit s'adresse aux chercheurs et développeurs qui doivent traiter des tâches de raisonnement complexes.