Das Tongyi Lab von Alibaba Cloud kündigte kürzlich die offizielle Open-Source-Veröffentlichung seines selbstentwickelten Such-IA-Agenten-Projekts WebAgent an. Die Schlüsselkomponenten WebShaper und WebSailor haben in der Domäne der Netzwerk-Intelligenzagenten große Aufmerksamkeit erregt. Als ein revolutionäres IA-Werkzeug zeigt WebAgent mit seiner end-to-end-fähigen selbstständigen Informationsrecherche und mehrschrittigen Schlussfolgerungsfähigkeit ein Niveau, das dem von menschlichen Experten gleichkommt oder sogar übertrifft.
WebAgent: Intelligenter Agent zur Nachahmung menschlicher Suche
WebAgent ist ein Open-Source-IA-Agent, der vom Tongyi Lab der Alibaba Cloud entwickelt wurde und darauf abzielt, den Wahrnehmungs-, Entscheidungs- und Handlungskreislauf eines Menschen im Netzwerk zu simulieren. Sein zentraler Zweck besteht darin, komplexe und unklare Netzwerk-Aufgaben effizient zu bewältigen, indem es autonom sucht und mehrschrittige Schlussfolgerungen zieht. WebAgent umfasst mehrere Schlüsselkomponenten, wobei WebSailor und WebShaper die technologischen Highlights darstellen. Laut offizieller Beschreibung kann WebAgent aktiv akademische Datenbanken, Nachrichtenseiten und Fachforen durchsuchen, relevante Informationen filtern und strukturierte Berichte erstellen. Es eignet sich weit verbreitet für Anwendungen wie wissenschaftliche Forschung, Geschäftsanalysen und alltägliche Abfragen.
Auf dem renommierten Bewertungssatz BrowseComp hat das Modell WebSailor-72B besonders hervorragende Leistungen gezeigt, es übertreffen DeepSeek R1 und Grok-3, geschlossene Modelle, und liegt nur hinter DeepResearch von OpenAI, was es auf den Spitzenplatz der Open-Source-Netzwerk-Agenten bringt. WebAgent erreichte außerdem bei den Benchmarks GAIA und WebWalkerQA hervorragende Ergebnisse mit 60,19 Punkten und 52,2 Punkten, was seine exzellente Leistung bei komplexen Aufgaben unterstreicht.
WebShaper: Neue Paradigmen der Daten-Synthese durch formale Antriebskräfte
WebShaper ist eine zentrale Innovation innerhalb des WebAgent-Ökosystems und präsentiert eine Methode zur Daten-Synthese, die auf „formaler Antriebskraft“ basiert. Diese Lösung behebt Probleme beim Schlussfolgern in Aufgaben mit hoher Unsicherheit. Durch die Verwendung von Mengentheorie konstruiert WebShaper einen mathematischen Darstellungsrahmen für Informations-Suchaufgaben und nutzt den Begriff „Wissen-Projection“, um den komplexen Suchprozess als Operationen auf Mengen von Entitäten abzubilden. Zum Beispiel kann WebShaper bei der Abfrage „Spieler, die in der Saison 2004-05 für die DDR-Fußballmannschaft gespielt haben und im 90er-Jahren geboren wurden“, systematisch Trainingsdaten generieren und sicherstellen, dass die IA bei mehrschrittigen Schlussfolgerungen präzise bleibt.
Der WebShaper-Datensatz umfasst verschiedene Bereiche wie Sport, Wissenschaft, Politik und Unterhaltung, wobei 21 % der Fragen im Sportbereich und 17 % im Wissenschaftsbereich liegen, was die breite Anpassungsfähigkeit des Wissens gewährleistet. Sein schrittweiser Erweiterungsansatz vermeidet Schlussfolgerungsweg und Informationsüberschuss, sodass die IA notwendigerweise einen vollständigen Schlussfolgerungsweg durchlaufen muss, um eine Antwort zu erhalten. In Experimenten zeigte die durch WebShaper trainierte Modellleistung bei gleicher Datenmenge deutlich bessere Ergebnisse als traditionelle Datensätze wie WebWalkerQA und E2HQA.
WebSailor: Der „Super-Netzwerk-Ermittler“ bei komplexen Aufgaben
Als das „Gehirn“ von WebAgent ist WebSailor ein großes Sprachmodell, das die Absicht des Nutzers versteht, die Besuchstrategie festlegt und die Schritte der Aktion bestimmt. Die neueste Version WebSailor-72B kann über Alibaba Cloud FunctionAI in einem Klick bereitgestellt werden, wodurch der Nutzer die Konfiguration in nur 10 Minuten abschließen kann und somit die Nutzungsschwelle stark reduziert wird. WebSailor zeigt bei Aufgaben mit hoher Unsicherheit ausgezeichnete Leistungen, beispielsweise bei unklaren Abfragen oder komplexen Szenarien, die eine Integration von Informationen aus verschiedenen Plattformen erfordern.
Die Ausbildung von WebSailor erfolgte mit dem innovativen SailorFog-QA-Datensatz, der durch Subgraph-Abtastung und Information-Bewusstseins-Technologie ein echtes Netzwerkumfeld nachahmt. Dieses Vorgehen verleiht dem Modell die Fähigkeit, „übermenschliche“ Aufgaben zu bearbeiten, zum Beispiel übertraf die Version WebSailor-32B und WebSailor-72B in der BrowseComp-Prüfung nicht nur alle Open-Source-Modelle, sondern auch einige geschlossene Systeme.
WebDancer und WebWalker: Aufbau eines vollständigen Ökosystems
Der Erfolg von WebAgent hängt von zwei Modulen ab: WebDancer und WebWalker. WebDancer ist ein end-to-end-Trainingsrahmen für intelligente Agenten, der die Mehrschritt-Suche von AI durch vier Phasen (Datenkonstruktion, Trajektoriesampling, überwachtes Mikrotraining und Verstärkungslernen) verbessert. Die neueste Version WebDancer-QwQ-32B erzielte bei der GAIA Pass@3-Bewertung eine hervorragende Leistung von 64,1 %. WebWalker ist ein Benchmark-Test-Tool, das die Leistung von Sprachmodellen bei komplexen Web-Besuchen bewertet und Entwicklern ein standardisiertes Bewertungssystem bietet, um Algorithmen zu optimieren.
Der gemischte Inferenzmodus von WebAgent verteilt dynamisch Rechenressourcen durch eine „Denkbudget-Mechanismus“, um die Balance zwischen schneller Antwort auf einfache Abfragen und tiefer Inferenz bei komplexen Aufgaben zu ermöglichen. In der Praxis kann WebAgent in 10 Minuten die Kataloge von Tesla und XPeng Automobil extrahieren und analysieren oder klinische Studiedaten aus Datenbanken wie PubMed extrahieren und eine Quellenberichte erstellen. Die Effizienz übertrifft dabei deutlich die menschliche Arbeit.
Open-Source-Bedeutung: Neuanordnung der Informationsverarbeitung und Gemeinschaftsinnovation
Die Open-Source-Veröffentlichung von WebAgent senkt nicht nur die Kosten für Unternehmen und Entwickler, sondern bietet der globalen AI-Gemeinschaft auch ein industrietaugliches Trainingsframework und Bewertungsstandards. Der GitHub-Repositorium (https://github.com/Alibaba-NLP/WebAgent) hat bereits über 4000 Star-Eintragungen und ist auf der GitHub trending-Liste auf Platz eins gelandet. Auf Huggingface ist er auf Platz drei im Monatsranking. Die Trainingsstrategie von WebSailor – die Generierung von hochschwierigen Aufgaben, kleine Skalen Cold Start und effiziente Verstärkungslernen-Optimierung – bietet der Open-Source-Gemeinschaft wertvolle Ansätze, um komplexe Schlussfolgerungsaufgaben zu meistern.
Von der wissenschaftlichen Forschung bis zur Geschäftsentscheidung hat WebAgent großes Anwendungspotenzial. Zum Beispiel können Forscher schnell die Themen der ACL2025-Papiere abrufen, Geschäftsbenutzer können Trends des AI-Chip-Marktes im Jahr 2025 analysieren und normale Benutzer können personalisierte Tipps für Reiseplanung oder Gesundheitsberatung erhalten. Die Open-Source-Veröffentlichung von WebAgent markiert den Übergang von technischen Demonstrationen zu Produktivitätsszenarien für AI-Agenten. In Zukunft könnte sie die weitere Entwicklung von multimodaler Informationsintegration und offener Bereichsinferenz vorantreiben.
GitHub: https://github.com/Alibaba-NLP/WebAgent
Huggingface: https://huggingface.co/datasets/Alibaba-NLP/WebShaper
model scope: https://modelscope.cn/datasets/iic/WebShaper