Der von ByteDance betriebene Engine Volcano hat kürzlich die Version 1.6 des Doubao-Modells veröffentlicht. Dies ist das erste inländische große Sprachmodell, das native Unterstützung für einstellenbare Denkzeiten bietet. Die neue Version bietet vier Stufen der Denkintensität: Minimal, Low, Medium und High, sodass Benutzer den Rechenspeicher je nach Komplexität der Aufgabe flexibel anpassen können und somit einen Ausgleich zwischen Qualität der Ausgabe und Reaktionsgeschwindigkeit erzielen.

Aus technischer Sicht ist die einstellbare Denkzeit eine der zentralen Funktionen dieser Aktualisierung. Bei niedriger Denkstufe reduziert sich der Token-Verbrauch bei der Erzeugung von Inhalten um 77,5 % gegenüber dem Einzelmodus, und die Rechenzeit wird um 84,6 % verkürzt, wobei die Ausgabeverlässlichkeit unverändert bleibt. Diese Mechanik ermöglicht es dem Modell, dynamisch auf Anforderungen der Szenarien zu reagieren – für einfache Fragen oder schnelle Entwürfe kann man die niedrige Stufe wählen, um die Reaktionsgeschwindigkeit zu erhöhen, während man bei komplexerem Schließen oder tieferer Analyse auf die höhere Stufe wechseln kann, um die Qualität der Ausgabe sicherzustellen.

Neben der Standardversion hat Volcano Engine auch die leichtere Version Doubao 1.6lite parallel veröffentlicht. Diese Version richtet sich hauptsächlich an unternehmensrelevante Anwendungsfälle und wurde in Bezug auf die Rechengeschwindigkeit und Kostenkontrolle optimiert. Laut offiziellen Testdaten verbesserte sich die Gesamtleistung von Doubao 1.6lite in Unternehmensszenarien im Vergleich zur vorherigen Version Doubao 1.5pro um 14 %. In Bezug auf die Kosten reduzierte sich bei der größten Nutzungsregion (0–32k Eingaben) der Gesamtverbrauch um 53,3 % gegenüber Doubao 1.5pro. Dieser Rückgang hat für Unternehmen mit großem Bedarf an Nutzung praktische Bedeutung.

Aus Produktpositionierungsperspektive zielt die stufenweise Denkmechanik von Doubao 1.6 auf Effizienzprobleme in realen Anwendungen ab. Traditionelle große Modelle verwenden meist feste Rechentiefe, was dazu führt, dass einfache Aufgaben übermäßige Berechnungen verursachen und Ressourcen verschwenden, während komplexe Aufgaben aufgrund zu geringer Rechenkapazität möglicherweise an Qualität verlieren. Mit der stufenweisen Mechanik können Benutzer passende Rechenressourcen entsprechend ihren spezifischen Anforderungen auswählen und so Kosten und Zeit optimieren, ohne die Qualität der Ausgabe zu beeinträchtigen.

Allerdings muss angemerkt werden, dass die genaue technische Umsetzung des Begriffs „Denkzeit“ noch nicht detailliert von der offiziellen Seite erklärt wurde. Aus der Beschreibung der Wirkung könnte es sich um Änderungen in der Anzahl der Schlussfolgerungsschritte, der internen Ketten-Denkzeit oder der Ressourcenverteilungsstrategie handeln. Benutzer müssen in der Praxis durch Tests die beste Übereinstimmung zwischen verschiedenen Aufgabentypen und Denkstufen finden, was bedeutet, dass es gewisse Lernkosten gibt.