阿里が画期的な発表:QwenLong-L1-32B、初の強化学習による長文推論モデル クラウド3.7と同等のパフォーマンス
アリババは本日、QwenLong-L1-32Bの正式発表を行いました。これは、長い文脈推論を専門とする大規模言語モデルで、AIの長期テキスト処理能力に大きなブレークスルーをもたらします。このモデルは、o3-miniやQwen3-235B-A22Bを上回るパフォーマンスを発揮し、Claude-3.7-Sonnet-Thinkingと同等のレベルに達しています。技術的革新のポイントとして、QwenLong-L1-32Bが世界で初めて強化学習を用いて訓練された点が挙げられます。