腾讯微信AI团队推出新型扩散语言模型WeDLM,旨在提升文本生成效率。该模型结合扩散模型与因果注意力机制,通过拓扑重排技术兼容KV缓存,解决了传统扩散模型因双向注意力导致的推理效率问题,突破了GPT等大模型在并行推理上的限制。