昆侖万維科技股份有限公司は先日、同社が開発した2つの新しい報酬モデル、Skywork-Reward-Gemma-2-27BとSkywork-Reward-Llama-3.1-8Bが、国際的に権威のある報酬モデル評価ベンチマークRewardBenchで卓越した性能を示したと発表しました。特にSkywork-Reward-Gemma-2-27Bモデルはトップの座を獲得し、RewardBench公式から高い評価を得ています。
Gemma-2-27Bアーキテクチャに基づく高度な報酬モデル
Skywork
Gemma-2-27Bアーキテクチャに基づく高性能報酬モデルで、精製されたSkywork-Reward-Preference-80K-v0.2データセットでトレーニングされ、複雑なシナリオにおける選好判断に優れています。
Skywork-Reward-Gemma-2-27Bはgemma-2-27b-itアーキテクチャに基づいて構築された先進的な報酬モデルで、複雑なシナリオにおける嗜好問題の処理に優れています。