Agent S ist ein offenes Agenten-Framework, das darauf abzielt, die autonome Interaktion mit Computern über eine grafische Benutzeroberfläche (GUI) zu ermöglichen und die Mensch-Computer-Interaktion durch die Automatisierung komplexer, mehrstufiger Aufgaben zu verändern. Es führt eine erfahrungsbasierte hierarchische Planungsmethode ein, die Online-Wissensquellen und episodisches Gedächtnis nutzt, um aus vergangenen Interaktionen fortgeschrittene Erfahrungen zu extrahieren, komplexe Aufgaben in handhabbare Unteraufgaben zu zerlegen und mit Hilfe des Arbeitsgedächtnisses schrittweise Anweisungen zu geben. Agent S optimiert kontinuierlich sein Vorgehen und lernt aus Erfahrung, um eine robuste und effiziente Aufgabenplanung zu erreichen. Agent S übertraf im OSWorld-Benchmark die Baseline um 9,37% Erfolgsrate (eine relative Verbesserung von 83,6%) und zeigte im WindowsAgentArena-Benchmark eine breite Kompatibilität.