Volc Engine, filiale de ByteDance, a récemment lancé la version 1.6 du modèle de grande taille Doubao, le premier modèle de langage à supporter nativement la régulation des longueurs de pensée en plusieurs niveaux en Chine. La nouvelle version propose quatre options de profondeur de réflexion : Minimal, Low, Medium et High, permettant aux utilisateurs d'ajuster flexiblement le processus de raisonnement du modèle selon la complexité de la tâche, pour équilibrer la qualité de sortie et la vitesse de réponse.

En termes de technologie, la longueur de pensée réglable est la fonction principale de cette mise à jour. En mode basse profondeur de réflexion, la consommation de tokens du Doubao 1.6 lors de la génération de contenu est réduite de 77,5 % par rapport au mode unique, et le temps de raisonnement est raccourci de 84,6 %, tout en maintenant la qualité de sortie. Ce mécanisme permet au modèle d'ajuster dynamiquement selon les besoins de la scène : pour des tâches simples comme des questions-réponses ou des brouillons rapides, on peut choisir un mode bas pour améliorer la vitesse de réponse, tandis que pour des tâches complexes ou une analyse approfondie, on peut passer à un mode élevé pour garantir la qualité de la sortie.

Hors de la version standard, Volc Engine a également lancé la version légère Doubao 1.6lite. Cette version est principalement destinée aux scénarios professionnels, avec des optimisations concernant la vitesse de raisonnement et le contrôle des coûts. Selon les données de test officielles, la performance globale du Doubao 1.6lite dans les tests professionnels s'est améliorée de 14 % par rapport à son prédécesseur, le Doubao 1.5pro. En termes de coût, pour l'intervalle d'entrée le plus utilisé (0-32k), le coût global d'utilisation est réduit de 53,3 % par rapport au Doubao 1.5pro, ce qui a une signification pratique pour les clients entreprises ayant besoin d'une utilisation importante.

En termes de positionnement produit, le mécanisme de régulation de la profondeur de réflexion du Doubao 1.6 vise à résoudre des problèmes d'efficacité rencontrés dans les applications pratiques. Les grands modèles traditionnels utilisent souvent une profondeur de raisonnement fixe, entraînant un gaspillage de ressources pour les tâches simples, ou une qualité insuffisante pour les tâches complexes. Le mécanisme de régulation permet aux utilisateurs de choisir le bon niveau de ressources informatiques selon les besoins spécifiques, optimisant ainsi les coûts et le temps tout en assurant la qualité de la sortie.

Cependant, il convient de noter que la manière exacte de mettre en œuvre le concept de « longueur de pensée » n'a pas été détaillée par l'entreprise. D'après les descriptions des effets, cela pourrait impliquer le nombre d'étapes de raisonnement, la profondeur interne de réflexion ou des stratégies d'allocation des ressources calculatoires. Les utilisateurs doivent tester pour trouver la meilleure correspondance entre les types de tâches et les niveaux de réflexion, ce qui implique un certain coût d'apprentissage.