震撼登場!英偉達開源圖像生成模型Sana ,1秒生圖、支持中英文和emoji
近日,英偉達開源了一款名爲 Sana 的圖像生成模型,這一模型僅有0.6億個參數,極大降低了運行門檻。據瞭解,Sana 能夠生成4096×4096分辨率的圖像,並且可以在16GB 的顯卡上運行,不到1秒的時間內生成1024×1024分辨率的高質量圖片,這一速度在同類模型中表現突出。Sana 的工作原理是依靠 DC-AE(雙通道自編碼器)技術,使用32倍的潛在空間進行圖像生成。該工具配備了8個 GPU 進行處理,其中包括性能強大的 GTX3090顯卡,使其在處理複雜圖像時速度更快、效果更佳。據稱,Sana0.6B性能上和Flux-12B