LMSYSチャットボットアリーナのランキング最新データによると、Gemini-1.5-Proは日本語、中国語、フランス語で1位を獲得し、強力な多言語能力を示しました。一方、GPT-4oは英語、ドイツ語、スペイン語で優れた性能を発揮し、首位を維持しています。また、Claude-3Opusはロシア語分野で優れた成績を収め、注目を集めています。
様々な言語モデルのパフォーマンスを比較するオンラインチャットボット競技場です。
大規模言語モデル(LLM)のパフォーマンス評価のための、クラウドソーシング型のオープンなプラットフォーム