昆仑万维科技股份有限公司近日宣布,公司研发的两款全新奖励模型Skywork-Reward-Gemma-2-27B和Skywork-Reward-Llama-3.1-8B在国际权威的奖励模型评估基准RewardBench上表现卓越,其中Skywork-Reward-Gemma-2-27B模型更是荣获榜首,得到了RewardBench官方的高度认可。
基于Gemma-2-27B架构的先进奖励模型
Skywork
基于Gemma-2-27B架构构建的高性能奖励模型,使用净化后的Skywork-Reward-Preference-80K-v0.2数据集训练,擅长处理复杂场景中的偏好判断。
Skywork-Reward-Gemma-2-27B是基于gemma-2-27b-it架构构建的先进奖励模型,擅长处理复杂场景下的偏好问题。