AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

通義千問聯合魔搭社區開源測試集P-MMEval:可評測模型多語言能力

阿里巴巴達摩院聯合魔搭社區ModelScope近期宣佈開源一項新的多語言基準測試集P-MMEval,旨在全面評估大型語言模型(LLM)的多語言能力,並進行跨語言遷移能力的比較分析。這一測試集覆蓋了基礎和專項能力的高效數據集,確保了所有挑選的數據集中多語言覆蓋的一致性,並提供了跨多種語言的並行樣本,最高支持來自8個不同語族的10種語言,包括英語、中文、阿拉伯語、西班牙語、日語、韓語、泰語、法語、葡萄牙語和越南語。

13.3k 3 天前
通義千問聯合魔搭社區開源測試集P-MMEval:可評測模型多語言能力

AI產品

查看更多
P-MMEval

P-MMEval

多語言多任務基準測試,用於評估大型語言模型(LLMs)

研究工具
6.4k
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖