最高のP-MMEval AIツールモデル_厳選P-MMEval情報

AIニュース

通義千問と魔搭コミュニティによるオープンソーステストセットP-MMEval：モデルの多言語能力を評価

アリババの達摩院と魔搭コミュニティModelScopeは最近、大規模言語モデル（LLM）の多言語能力を包括的に評価し、クロスリンガル転移能力の比較分析を行うことを目的とした、新しい多言語ベンチマークテストセットP-MMEvalをオープンソースとして公開しました。このテストセットは、基礎能力と専門能力の高効率データセットを網羅しており、選択されたすべてのデータセットで多言語の網羅性を確保し、複数の言語にまたがる並列サンプルを提供します。最大で8つの異なる語族の10言語、英語、中国語、アラビア語などをサポートします。

9k 14 時間前

AI製品

P-MMEval

大規模言語モデル（LLM）の評価のための多言語多タスクベンチマーク

研究ツール

7.6k

未来を力づける、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

ビジネス協力サイトマップ