メイドゥー LongCat チームが VitaBench を発表:新しいスマートエージェントの評価基準
メイドゥー LongCat チームは、VitaBench スマートエージェント評価基準を発表しました。このベンチマーカーは、配達注文、レストランでの食事、旅行など、頻繁な生活シーンに焦点を当てています。この基準では66種類のツールを含むインタラクティブ環境が構築され、チケット購入から予約まで複雑な操作をカバーし、現実的なシナリオにおけるスマートエージェントの開発に重要なインフラストラクチャを提供します。