智源研究院、世界初の中国語大規模言語モデル論争プラットフォームFlagEval Debateを発表
北京智源人工知能研究院(BAAI)は最近、世界初の中国語大規模言語モデル論争プラットフォームFlagEval Debateを発表しました。この新しいプラットフォームは、モデル間の論争という競争メカニズムを通じて、大規模言語モデルの能力評価のための新しい測定方法を提供することを目的としています。これは、智源モデル対戦評価サービスFlagEval大規模言語モデル競技場の拡張であり、大規模言語モデル間の能力の違いを識別することを目標としています。