近年の人工知能研究において、思考の連鎖(チェーンオブシンキング)の概念がますます注目を集めています。特に大規模言語モデルの訓練や推論においてその重要性が増しています。最近、西湖大学MAPLE研究所の齊國君(さいこっきん)教授率いるチームは、従来の手法とは異なる新たな「拡散型発散思考チェーン」を提案しました。これは拡散言語モデルに特化した新しい推論方法です。

従来の大規模言語モデルは一般的に線形的な思考チェーンを使用しており、段階的に推理を行い答えを導きます。しかし、人間の思考プロセスは複雑で、非線形かつジャンプする特性を持っています。齊教授のチームは、この発散的な思考を模倣することで、モデルの創造力や問題解決能力を向上させると考えています。

image.png

拡散型発散思考チェーンの核心となるのは、モデルが推論プロセス中に任意の順序で中間結果を生成できる点です。伝統的な文法構造や可読性の要件に縛られることはありません。このアプローチにより、モデルはより多様な思考ルートを探索し、創造的で柔軟な答えを形成できます。この方法は、数学の推論やコード生成タスクなどさまざまな拡散言語モデルで成功しており、既存のモデルよりも優れた性能を示しています。

実際の実装では、チームは強化学習を通じて全体的なプロセスを最適化しました。モデルは最初に無情報のマスクシーケンスから始まり、重要な情報を段階的に生成します。拡散デノイズの過程を経て最終的な答えを導出します。従来の思考チェーンと異なり、拡散思考チェーンは中間生成物を利用して最終答えの正確性を高めることができます。

研究チームの成果は、拡散型発散思考チェーンがモデルの推論能力を向上させるだけでなく、将来のモデルトレーニングにも重要な示唆を与えたことを示しています。この革新的な思考チェーン手法は、特にGoogleが最近リリースしたGemini Diffusionモデルにおいても広い応用可能性を示しています。将来的には、拡散型思考チェーンが拡散言語モデルのトレーニングの標準的なプロセスになる可能性があります。

arXivリンク: https://arxiv.org/abs/2505.10446

GitHubリンク: https://github.com/maple-research-lab/LLaDOU