AIBase
首頁
AI 資訊
AI 產品庫
GEO 平台
MCP 服务
模型算力廣場
AI 全能力超市
TW

AI資訊

查看更多

美團 LongCat 團隊推出 VitaBench:全新智能體評測基準

美團LongCat團隊推出VitaBench智能體評測基準,聚焦外賣點餐、餐廳就餐和旅遊出行等高頻生活場景。該基準構建含66個工具的交互環境,覆蓋購票到預訂等複雜操作,爲智能體在真實場景的研發提供重要基礎設施。

12.2k 1 天前
美團 LongCat 團隊推出 VitaBench:全新智能體評測基準
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖