大模型評測平臺Compass Arena新增多模態大模型競技版塊
上海人工智能實驗室的司南 OpenCompass 團隊與魔搭 ModelScope 合作,推出了 Compass Multi-Modal Arena,這是一個大模型評測平臺的新版塊,專注於多模態大模型。用戶可通過上傳圖像並輸入問題,讓兩個匿名多模態大模型生成答案,然後基於生成內容的質量進行主觀評估,選擇表現更佳的模型。平臺提供簡單易用的界面和特色題庫,題庫側重於主觀視覺問答任務,如迷因理解、藝術品賞析和攝影作品賞析。此平臺旨在評估多模態大模型在主觀任務上的性能和用戶體驗,並已向公衆開放。