テンセントWeChat AIチームは新型の拡散言語モデルWeDLMを発表しました。このモデルはテキスト生成の効率を向上させるために設計されています。拡散モデルと因果的注意機構を組み合わせ、トポロジカルな再配置技術によりKVキャッシュに互換性を持たせ、従来の拡散モデルが双方向の注目によって引き起こす推論効率の問題を解決し、GPTなどの大規模モデルが並列推論において抱えていた制限を打ち破りました。