アリババは GitHub で、革新的な自律型検索 AI エージェントである WebAgent を公開しました。この AI エージェントは、エンドツーエンドの情報検索と複数ステップの推論能力を持ち、インターネット環境で人間のように能動的に検索、分析、意思決定を行うことができます。その登場により、研究者の情報収集と整理の効率が大幅に向上します。

image.png

WebAgent の主な機能

WebAgent はユーザーが特定分野の最新研究成果を迅速に取得できるように設計されています。ユーザーが特定のテーマに関するクエリを送信すると、WebAgent は複数の学術データベースを訪問し、関連する文献をフィルタリングして、ユーザーの要求に基づいて詳細な分析とまとめを行います。このプロセスにより、情報の検索効率が向上し、研究レポートの包括性と正確性が保証されます。

image.png

明確に分かれた二つのモジュール

WebAgent には、WebDancer と WebWalker の二つの主要なモジュールがあります。WebDancer はネットワーク情報検索能力を高めるためのインテリジェントなトレーニングフレームワークであり、WebWalker はウェブ遍歴用の言語モデルベンチマークツールです。

1. **WebDancer のトレーニングプロセス **

   WebDancer のトレーニングプロセスは四つの段階に分けられています。データ構築からモデル最適化までの一連の流れにより、複雑な情報検索を自律的に行うことができるエージェントが形成されます。まず、データ構築段階では、従来のデータセットの限界を克服するために革新的な方法を使って高品質なトレーニングデータを生成します。次に、スーパーバイズドファインチューニング(SFT)段階では、高品質な軌跡データを使用してエージェントを初期トレーニングし、情報検索要件に適合させるために調整を行います。最後に、強化学習段階では、エージェントが複雑なタスクの中で最適な意思決定を行うよう、環境との相互作用を通じて学習します。使用される DAPO アルゴリズムにより、データ効率と戦略の堅牢性が著しく向上しました。

2. **複数ステップの推論能力 **

   WebAgent の複数ステップの推論能力により、異なる文献の意見を統合して包括的な研究レポートを生成することができます。この機能は学術研究や市場分析などの分野で非常に価値があります。

アリババが WebAgent をオープンソースとして公開したことで、研究者たちに強力なツールを提供し、AI 分野の研究と発展に新たな活力を注入しました。

Github:https://github.com/Alibaba-NLP/WebAgent