AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

美團LongCat發佈創新基準測試UNO-Bench,全面提升多模態大語言模型評估能力

美團LongCat團隊推出UNO-Bench基準測試,系統評估多模態模型能力。該基準覆蓋44種任務類型和5種模態組合,包含1250個全模態樣本(跨模態可解性98%)及2480個增強單模態樣本,全面測試模型在單模態與全模態場景下的性能表現。

11.1k 7 小時前
美團LongCat發佈創新基準測試UNO-Bench,全面提升多模態大語言模型評估能力
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖