英伟达开源文生图模型Sana 笔记本电脑也能秒速生成4K超高清图像
AI 图像生成技术正在飞速发展,但模型体积越来越大,对普通用户来说,训练和使用成本都非常高。现在,一种名为 “Sana” 的新型文本到图像框架横空出世,它能够高效生成高达4096×4096分辨率的超高清图像,而且速度惊人,甚至可以在笔记本电脑的 GPU 上运行。Sana 的核心设计包括:深度压缩自编码器:与传统自编码器仅压缩图像8倍不同,Sana 使用的自编码器可以将图像压缩32倍,从而有效地减少了潜在的 tokens 数量。这对于高效训练和生成超高分辨率图像至关重要。线性 DiT:Sana 用线性注意