震撼登场!英伟达开源图像生成模型Sana ,1秒生图、支持中英文和emoji
近日,英伟达开源了一款名为 Sana 的图像生成模型,这一模型仅有0.6亿个参数,极大降低了运行门槛。据了解,Sana 能够生成4096×4096分辨率的图像,并且可以在16GB 的显卡上运行,不到1秒的时间内生成1024×1024分辨率的高质量图片,这一速度在同类模型中表现突出。Sana 的工作原理是依靠 DC-AE(双通道自编码器)技术,使用32倍的潜在空间进行图像生成。该工具配备了8个 GPU 进行处理,其中包括性能强大的 GTX3090显卡,使其在处理复杂图像时速度更快、效果更佳。据称,Sana0.6B性能上和Flux-12B