コンラント・ワンウェイが再びリワードモデルSkywork-Reward-V2をオープンソース化
2025年7月4日、コンラント・ワンウェイは勢いに乗って、第二世代のリワードモデル「Skywork-Reward-V2」シリーズをオープンソース化しました。このシリーズには、異なるベースモデルに基づいており、パラメータ数が6億から80億に至る8つのリワードモデルが含まれています。発表後すぐに、主要な7つのリワードモデル評価リストで全カテゴリーで優勝し、オープンソースリワードモデル分野の注目を集めました。リワードモデルは、人間からのフィードバックをもとにした強化学習(RLHF)プロセスにおいて重要な役割を果たします。次世代のリワードモデルを開発するために、コンラント・ワンウェイは4000万件のデータセットを構築しました。