秒杀SD?谷歌 DeepMind 新型图像生成模型Fluid性能更出色
谷歌 DeepMind 联合麻省理工学院(MIT)近日发布了一项重大研究成果。研究团队开发的新型自回归模型"Fluid"在文本到图像生成领域取得了突破性进展,该模型在扩展到105亿参数规模后,性能表现出色。这项研究颠覆了业界普遍认知。此前,自回归模型虽然在语言处理领域占据主导地位,但在图像生成方面一直被认为不如 Stable Diffusion 和 Google Imagen3等扩散模型。研究人员通过创新性地引入两个关键设计因素,显著提升了自回归模型的性能和可扩展性:采用连续型词元替代离散型词元,以及引入