智譜AI、中文LLMアラインメント評価基準AlignBenchを発表
智譜AIは、中国語大規模言語モデルのための評価基準AlignBenchを発表しました。AlignBenchは、多角的な視点からモデルと人間の意図との整合度を詳細に評価できます。データセットは、知識応答、文章生成、ロールプレイングなど、8つの主要なカテゴリに分類され、多様なタイプの問題が含まれています。開発者はAlignBenchを使用してモデルを評価し、評価能力の高いスコアモデルを用いてスコアを算出できます。AlignBenchウェブサイトにアクセスして結果を提出することで、Critiqueを使用できます。