字節跳動發佈實驗性擴散語言模型 Seed Diffusion Preview
字節跳動Seed團隊宣佈推出實驗性擴散語言模型Seed Diffusion Preview,標誌着在語言模型領域的一次重大技術突破。該模型旨在通過結構化的代碼生成實驗,驗證離散擴散技術路線作爲下一代語言模型基礎框架的可行性。Seed Diffusion Preview在推理速度上取得了顯著提升,達到每秒2146個tokens,相比同等規模的自迴歸模型提升了5.4倍,同時在多個代碼生成基準測試中表現出與自迴歸模型相當的性能。
Seed Diffusion Preview的發佈,旨在解決自迴歸(AR)模型在推理速度和全局控制方面的侷限性。擴散模型通過從粗到精的生成範式,在圖像和視頻合成等連續數據領域取得了顯著成功。然而,將擴散模型應用於自然語言等離散領域面臨根本性挑戰,主要在於標準擴散過程與離散狀態空間的不兼