ホーム
情報

AIデータセット

モデルの訓練・評価・テスト用大規模データセット・ベンチマーク

ツール

インテリジェント文書認識

ユーザーに各種文書のテキスト抽出・文書処理を提供、汎用・カスタムシーン対応の多様な文書処理をサポート

AIチュートリアル

ChainForge-R1-SuperCoT

Public

A multi-stage pipeline that enhances Qwen2.5 language models with DeepSeek Reasoner's chain-of-thought capabilities. Implements the DeepSeek-R1 methodology through cold-start SFT, reasoning-oriented RL, rejection sampling, and optional model distillation.

作成時間2025-01-25T03:13:53
更新時間2025-02-24T17:02:19
10
Stars
0
Stars Increase

関連プロジェクト