HelpSteer2
高性能報酬モデルをトレーニングするためのオープンソースデータセットです。
一般製品オープンソースオープンソースデータセット報酬モデル
HelpSteer2は、NVIDIAが公開したオープンソースデータセットです。モデルをより有益で、事実的で、首尾一貫したものにするために、応答の複雑さと冗長性を調整しながらモデルを調整するトレーニングを支援することを目的としています。Scale AIとの協力により作成され、Llama 3 70Bベースモデルと共に使用した場合、RewardBenchで88.8%の性能を達成し、2024年6月12日時点で最高の報酬モデルの一つとなっています。
HelpSteer2 最新のトラフィック状況
月間総訪問数
25537072
直帰率
44.24%
平均ページ/訪問
5.9
平均訪問時間
00:04:47