最好的P-MMEval AI工具模型_精選P-MMEval資訊

AI資訊

通義千問聯合魔搭社區開源測試集P-MMEval：可評測模型多語言能力

阿里巴巴達摩院聯合魔搭社區ModelScope近期宣佈開源一項新的多語言基準測試集P-MMEval，旨在全面評估大型語言模型（LLM）的多語言能力，並進行跨語言遷移能力的比較分析。這一測試集覆蓋了基礎和專項能力的高效數據集，確保了所有挑選的數據集中多語言覆蓋的一致性，並提供了跨多種語言的並行樣本，最高支持來自8個不同語族的10種語言，包括英語、中文、阿拉伯語、西班牙語、日語、韓語、泰語、法語、葡萄牙語和越南語。

14.4k 3 小時前

AI產品

P-MMEval

多語言多任務基準測試，用於評估大型語言模型（LLMs）

研究工具

9.4k

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖