Inmitten der raschen Entwicklung von multimodalen großen Sprachmodellen (MLLM) haben ByteDance und Tsinghua University kürzlich den neuen zeitlichen multimodalen großen Modell namens ChatTS gemeinsam veröffentlicht. Die Einführung von ChatTS gibt dem Umgang mit und der Inferenz von zeitlichen Daten neue Impulse und schließt eine Lücke im Markt in diesem Bereich. Das Ziel der Entwicklung dieses Modells besteht darin, die Anwendungsstärke von KI bei Fragen und Schlussfolgerungen aus zeitlichen Daten zu verbessern, insbesondere in Szenarien wie AIOps und Finanzen, wo komplexe zeitliche Daten verarbeitet werden müssen.
Die Hauptautoren dieser Studie sind das dritte Jahr Doktorand Xie Zhe von Tsinghua University. Das KooperationsTeam umfasst auch Li Zeyan und He Xiao von ByteDance. Die Betreuung erfolgte durch Zhang Tieying, Forschungswissenschaftler von ByteDance, sowie Dan Pei, Professor am Institut für Informatik an Tsinghua University. Ein Kernvorteil von ChatTS liegt in seiner nativen Unterstützung für mehrdimensionale zeitliche Fragestellungen und Schlussfolgerungen, wodurch die bisherigen Grenzen beim Umgang mit zeitlichen Daten bei anderen Modellen überwunden werden.

Bisher hing die Analyse von zeitlichen Daten von traditionellen statistischen Modellen oder KI-Modellen ab, die oft große Mengen an spezifischem Trainingsdaten und komplexe Vorverarbeitung benötigen. Dies führt dazu, dass Generalität und Erklärbarkeit ihre Hauptnachteile darstellen. ChatTS wurde entwickelt, um diese Situation zu ändern, indem es seine starke Sprachmodellierungskapazität nutzt, um ein natürliches Verständnis für zeitliche Daten zu erreichen.
Um die Übereinstimmungsprobleme zwischen Zeitreihen und Sprache zu bewältigen, verwendete das Forscherteam einen "reinen synthetischen Ansatz", um einen End-zu-Ende-Datengenerierungs- und Modelltraining-Frame zu entwerfen. Durch die Konstruktion eines "attribute-getriebenen" Zeitreihengeneriersystems kann ChatTS vielfältige und realistische Zeitreihendaten generieren und gleichzeitig eine genaue Übereinstimmung mit der naturlichen Sprachbeschreibung sicherstellen.

In konkreten Anwendungen kann ChatTS die Form mehrdimensionaler Zeitreihen analysieren, unbekannte Schwankungsmuster erkennen und automatisch benennen. Darüber hinaus kann das Modell auch ohne genaue Hinweise exakte Abweichungen in den Zeitreihendaten extrahieren, was seine Flexibilität und intelligente Merkmale zeigt.

Die Einführung dieses innovativen Modells wird die Anwendung von Zeitreihendaten in verschiedenen Branchen stark vorantreiben und möglicherweise in Zukunft in der Fehlerdiagnose und Finanzanalyse wichtige Rollen spielen. Die Ergebnisse von ChatTS wurden vom renommierten Datenbankkonferenz VLDB2025 akzeptiert, was deren wissenschaftlichen Mehrwert und praktische Anwendungspotenzial unterstreicht.
