AIBase
首頁
AI資訊
AI產品庫
GEO平台
MCP服务
模型算力廣場
TW

AI資訊

查看更多

大模型評測平臺CompassArena升級 推出全新 Judge Copilot 功能

上海人工智能實驗室司南OpenCompass團隊與魔搭ModelScope聯合推出的大模型評測平臺CompassArena(大模型競技場)近日迎來了新升級,旨在爲用戶提供更科學、全面的模型評估體驗。自上線以來,該平臺吸引了大量社區用戶參與並貢獻數據,基於這些數據,CompassArena不斷優化,此次升級包括全新Judge Copilot功能和榜單算法的改進,以及新增20多個全新模型。

14.6k 4 天前
大模型評測平臺CompassArena升級 推出全新 Judge Copilot 功能

大模型評測平臺Compass Arena新增多模態大模型競技版塊

上海人工智能實驗室的司南 OpenCompass 團隊與魔搭 ModelScope 合作,推出了 Compass Multi-Modal Arena,這是一個大模型評測平臺的新版塊,專注於多模態大模型。用戶可通過上傳圖像並輸入問題,讓兩個匿名多模態大模型生成答案,然後基於生成內容的質量進行主觀評估,選擇表現更佳的模型。平臺提供簡單易用的界面和特色題庫,題庫側重於主觀視覺問答任務,如迷因理解、藝術品賞析和攝影作品賞析。此平臺旨在評估多模態大模型在主觀任務上的性能和用戶體驗,並已向公衆開放。

16.3k 9 小時前
大模型評測平臺Compass Arena新增多模態大模型競技版塊
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖