秒殺SD?谷歌 DeepMind 新型圖像生成模型Fluid性能更出色
谷歌 DeepMind 聯合麻省理工學院(MIT)近日發佈了一項重大研究成果。研究團隊開發的新型自迴歸模型"Fluid"在文本到圖像生成領域取得了突破性進展,該模型在擴展到105億參數規模後,性能表現出色。這項研究顛覆了業界普遍認知。此前,自迴歸模型雖然在語言處理領域佔據主導地位,但在圖像生成方面一直被認爲不如 Stable Diffusion 和 Google Imagen3等擴散模型。研究人員通過創新性地引入兩個關鍵設計因素,顯著提升了自迴歸模型的性能和可擴展性:採用連續型詞元替代離散型詞元,以及引入