アリババのWebShaperがリリース!GAIAはClaude 3.5 SonnetやGPT-4oを上回る
アリババ通義ラボはオープンソースツールのWebShaperを発表しました。このツールは、形式的なドライバ情報検索パラダイムを採用し、GAIAベンチマークテストで60.19点を記録し、Claude 3.5 SonnetやGPT-4oを上回りました。このフレームワークは構造化データ生成法により、知識構造と推論ロジックの一貫性を保証し、AIによる複雑なタスク処理能力を大幅に向上させます。WebAgentシリーズの4番目のツールであるWebShaperはGitHubで4000以上のスターを獲得しており、オープンソースAIコミュニティの発展を推進しています。