马毅团队在新研究中提出了白盒Transformer结构CRATE,通过压缩高维数据实现有效表征,解决大模型的安全性问题。该研究揭示了深度学习的本质可能是压缩,CRATE在实验中表现出更强的可解释性,为深度学习领域带来新的范式。