AIBase
ホーム
AIニュース
AIツール
GEO & AEO
MCP
AIモデル
JA

AIニュース

もっと見る

Meta、マルチターン多言語指示遵守能力を評価する新しいMulti-IFベンチマークを発表

Metaは最近、大規模言語モデル(LLM)のマルチターン会話と多言語環境における指示遵守能力を評価することを目的とした、新しいベンチマークであるMulti-IFを発表しました。このベンチマークは8つの言語を網羅し、4501個の3ターン会話タスクを含んでおり、複雑なマルチターンと多言語シナリオにおける現在のモデルのパフォーマンスに焦点を当てています。既存の評価基準のほとんどは、シングルターンの会話と単一言語タスクに集中しており、モデルの実際のアプリケーションにおけるパフォーマンスを包括的に反映することは困難です。Multi-IFの発表はまさにそのためです。

10k 7 時間前
Meta、マルチターン多言語指示遵守能力を評価する新しいMulti-IFベンチマークを発表
AIBase
未来を力づける、あなたの人工知能ソリューションシンクタンク
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
ビジネス協力サイトマップ