大規模言語モデル評価プラットフォームCompass Arenaにマルチモーダル大規模言語モデル競技セクション追加
上海人工知能研究所の司南 OpenCompassチームと魔搭 ModelScopeが協力して、Compass Multi-Modal Arenaをリリースしました。これは大規模言語モデル評価プラットフォームの新しいセクションであり、マルチモーダル大規模言語モデルに焦点を当てています。ユーザーは画像をアップロードして質問を入力することで、2つの匿名のマルチモーダル大規模言語モデルに回答を生成させ、生成されたコンテンツの質に基づいて主観的な評価を行い、より優れたパフォーマンスを示したモデルを選択できます。プラットフォームはシンプルで使いやすいインターフェースと特徴的な問題集を提供しており、問題集の側面は…