OpenPipe
Qwen 2.5 32B Instructを基に強化学習微調整で訓練されたモデルで、Temporal Clueデータセットの挑戦的な演繹推論問題を解決するために特別に設計されています。