快手がKAT-V1大モデルをオープンソース化:自動思考能力が大幅に向上 40BバージョンのパフォーマンスはDeepSeek-R1に近づき、200Bバージョンは複数のエリートモデルを上回る
快手がオープンソースしたKAT-V1自動思考大モデルには、40Bおよび200Bの2つのバージョンが含まれます。40BバージョンのパフォーマンスはDeepSeek-R1に近づき、200Bバージョンはいくつかのエリートモデルを上回っています。このモデルは、長所と短所の混合トレーニングアプローチとStep-SRPO強化学習アルゴリズムを独自に採用しており、問題の複雑さに応じて自動的に思考モードを調整し、過度な思考の問題を解決できます。Qwen2.5-32Bに基づき、異質蒸留フレームワークと1000万個の例を用いた前訓練により、科学やコードなどの分野で優れた性能を発揮します