Im Bereich der Künstlichen Intelligenz hat die Team DeepResearch von Tongyi eine neue Forschungsleistung veröffentlicht, die auf breite Aufmerksamkeit gestoßen ist. Dieser Durchbruch ermöglicht es AI nicht nur, „zu chatten“, sondern auch „Forschung zu betreiben“. Darüber hinaus zeigt das Team mit offener Haltung die herausragende Leistung seiner Technologie. DeepResearch von Tongyi erreichte in mehreren renommierten Benchmarks führende Ergebnisse, wobei die Gesamtleistung sogar viele internationale Modelle übertrifft. Zudem sind Modell, Framework und Lösungen vollständig Open Source, wodurch die Produktivität der tiefen Forschung jedem zugänglich wird.
Im Gegensatz zu teuren und eingeschränkten Modellen auf internationaler Ebene hat das Team DeepResearch von Tongyi eine völlig offene Strategie gewählt und bietet eine Reihe von Tools und Lösungen an. In verschiedenen Testprojekten, wie Humanity's Last Exam, BrowseComp und GAIA, zeigte das leichtgewichtige Modell 30B-A3B beeindruckende Ergebnisse und erreichte den Stand der Technik.

Es ist erwähnenswert, dass das Team auf seiner Website und auf GitHub eine detaillierte Methodik zur Erstellung des DeepResearch Agents geteilt hat. Dabei werden alle Schritte vom Daten-Synthese bis zur Verstärkenden Lernmethode abgedeckt. Im Hinblick auf die Inferenz zeigt das Modell zwei Vorteile: Der grundlegende ReAct-Modus kann die Potenzial des Modells ohne komplexe Prompting vollständig entfalten, während der tiefere Modus die Fähigkeit für komplexe Schlussfolgerungen und Planung weiter verbessert.

Auch im Bereich der Datenstrategie hat das Team DeepResearch von Tongyi bedeutende Beiträge geleistet. Sie verwenden eine mehrstufige Datenstrategie, um hochwertige Trainingsdaten unter Vermeidung teurer manueller Annotationen durch inkrementelle Vortrainierung und Nachtrainierung zu generieren. Darüber hinaus gibt es zwei Arten von Inferenzmodi: den nativen ReAct-Modus und den Heavy-Modus für komplexe Aufgaben, was die Lösung anspruchsvoller Forschungsaufgaben erleichtert.

Während des Prozesses der Verstärkenden Lernmethode optimiert das Team DeepResearch von Tongyi Algorithmen und stabile Infrastrukturen, um kontinuierlich die Leistung des Modells zu verbessern. Sie setzen gezielte Strategien ein, um sicherzustellen, dass die Signale während des Lernprozesses präzise übereinstimmen und schließlich effiziente Lernerfolge erzielen.
Die Veröffentlichung von Tongyi DeepResearch bietet nicht nur einen neuen Weg für die Forschung im Bereich der Künstlichen Intelligenz, sondern reagiert auch aktiv auf die globale Technologiegemeinschaft und zeigt die starke Kraft der Offenheit und Zusammenarbeit.




