rlvr-gsm8k-benchmark
PublicComprehensive benchmarking framework for RLVR/RLHF libraries on GSM8K mathematical reasoning dataset
モデルの訓練・評価・テスト用大規模データセット・ベンチマーク
ユーザーに各種文書のテキスト抽出・文書処理を提供、汎用・カスタムシーン対応の多様な文書処理をサポート
Comprehensive benchmarking framework for RLVR/RLHF libraries on GSM8K mathematical reasoning dataset