Le 16 janvier 2025, Shanghai Jieyue Xingchen Intelligent Technology Co., Ltd. a annoncé le lancement officiel de son modèle d'inférence auto-développé, Step Reasoner mini (appelé « Step R-mini »). Les utilisateurs peuvent se connecter à la page Web Yuewen à l'adresse https://yuewen.cn et sélectionner « Step R-mini » dans le coin supérieur gauche pour l'essayer.

Step R-mini est le premier modèle d'inférence de la famille de modèles Step. Il excelle dans la planification proactive, l'expérimentation et la réflexion. Grâce à un mécanisme logique basé sur la réflexion lente et la vérification répétée, il fournit des réponses précises et fiables aux utilisateurs. Il est capable de résoudre des problèmes complexes de raisonnement logique, de codage et de mathématiques grâce à sa capacité de raisonnement ultra-long, tout en gérant les domaines d'application générale tels que la création littéraire.

La matrice de modèles de base de la série Step, développée par Jieyue Xingchen, couvre désormais des capacités complètes allant du langage et du multimédia à l'inférence. Sur les tests de référence mathématiques tels qu'AIME et Math, les résultats de Step R-mini ont dépassé ceux de o1-preview et sont comparables à ceux d'OpenAI o1-mini. Sur la tâche de codage LiveCodeBench, il a également obtenu de meilleurs résultats que o1-preview. Il est important de noter que la plupart des modèles d'inférence ont du mal à concilier les compétences scientifiques et littéraires. Cependant, Step R-mini, grâce à un entraînement intensif d'apprentissage par renforcement et à l'utilisation de l'algorithme d'apprentissage par renforcement On-Policy (même politique), a réussi à maîtriser les deux domaines. Il peut répondre avec précision aux questions de mathématiques, de codage et de raisonnement logique, tout en réalisant des tâches de création littéraire et de conversation quotidienne de manière créative.

微信截图_20250116133149.png

Dans les applications réelles, Step R-mini a démontré des performances exceptionnelles. Lorsqu'il s'agit de résoudre des problèmes de mathématiques, même des problèmes de mathématiques difficiles, il peut construire une chaîne de raisonnement logique, planifier et résoudre des problèmes mathématiques complexes étape par étape, et vérifier les différentes solutions par comparaison. Pour les problèmes de géométrie, il peut activement créer des croquis pour construire un support de réflexion approfondie. Dans les tâches de raisonnement logique, il essaie différentes approches de résolution de problèmes et s'interroge lui-même pour s'assurer qu'il a trouvé toutes les bonnes solutions. Pour les problèmes de codage, il peut résoudre correctement des problèmes d'algorithmes classés « Difficile » sur la plateforme technique LeetCode, et gérer des besoins de développement complexes, en analysant progressivement les besoins et les intentions de l'utilisateur pour construire la logique du code. En matière de création de contenu, il peut comprendre en profondeur les besoins exprimés par l'utilisateur, analyser les thèmes de création, les genres littéraires, etc., réfléchir à l'angle de création, décrire les scènes, les figures de style, la structure du contenu, donner aux choses une signification symbolique au niveau des émotions humaines, et ajouter un style d'expression personnalisé et innovant. Pour les problèmes de traduction, il suit le principe de « fidélité, expressivité et élégance », en visant à fournir des résultats de traduction précis et riches en sens.

Outre les modèles de raisonnement linguistique, Jieyue Xingchen développe également des modèles de raisonnement visuel, intégrant les capacités de raisonnement dans des modèles plus grands et plus interactifs. Pour les problèmes de raisonnement dans des scènes visuelles complexes, il introduit l'idée de perception lente et de raisonnement spatial, transférant le Test-Time Scaling de l'espace textuel à l'espace visuel, réalisant ainsi le Spatial-Slow-Thinking dans l'espace visuel. Actuellement, le modèle de raisonnement visuel a obtenu des résultats intermédiaires, et la version officielle devrait être présentée cette année.