大規模言語モデル(LLM)の急速な発展に伴い、単一のエージェントは複雑な現実的なタスクに対応する際に多くの制限が明らかになっています。この問題を解決するために、香港大学とcamel-aiなどの複数の機関が共同で、新しいマルチエージェントフレームワーク「Workforce」と、それに付随する「OWL(Optimized Workforce Learning)」というトレーニング手法を発表しました。最近、この革新的な成果は権威ある基準テストGAIAにおいて69.70%の正確率を達成し、オープンソースシステムの記録を更新し、さらにOpenAIやDeep Researchなど多くの商業システムを上回りました。
この研究成果の全コードはGitHubでオープンソース化され、現在すでに17,000を超えるスターを獲得し、コミュニティからのこの革新に対する支持が示されています。
では、「Workforce」フレームワークはどのようにしてマルチエージェントシステムの限界を克服しているのでしょうか?その鍵となるのは革新的な「分離設計」です。フレームワークは全体を3つの重要な構成要素に分割しています:ドメイン非依存のプランナー(Planner Agent)、スマートな調整エージェント(Coordinator Agent)、そして専門ワーカーノード(Worker Nodes)。このような設計により、システムの柔軟性が向上し、異なる分野への移行の複雑さが大幅に軽減されました。特に新しい分野に適応する必要がある場合、ユーザーはプランナーではなくワーカーノードを置き換えたり追加したりするだけで済み、コアシステム全体を再構築する必要はありません。
一方、「OWL」トレーニング手法はこのフレームワークのもう一つの特徴です。この手法は二段階のトレーニング戦略を採用しており、第一段階は専門家のデモデータを使用したスーパービジョン微調整を行い、プランナーを初期段階で訓練します。第二段階では強化学習最適化を行い、ダイレクトプレファレンスオプティマイゼーション(DPO)アルゴリズムを利用して決定能力をさらに向上させています。これらの最適化により、プランナーは現実世界の多様なタスクを処理できるようになりました。
GAIA基準テストでは、「Workforce」フレームワークが顕著な優位性を示し、特にマルチエージェント推論において69.70%の正確率を達成し、従来のオープンソースシステムを大きく上回りました。「OWL」トレーニング手法もテストで良好な結果を出し、Qwen2.5-32B-Instructモデルのパフォーマンスを向上させました。この進展により、マルチエージェントシステムは複雑なタスクを処理する際、従来の設計思想に縛られることなく、自己修正と進化能力を持つことが可能となりました。
「Workforce」フレームワークの登場により、マルチエージェントシステム全体のパフォーマンスが向上し、知能アシスタントの未来への道筋を示しました。