Sana es un marco de generación de imágenes a partir de texto desarrollado por NVIDIA, capaz de generar imágenes de alta eficiencia con una resolución de hasta 4096×4096 píxeles. Se destaca por su velocidad y la potente alineación texto-imagen, pudiendo desplegarse en una GPU de portátil. Representa un importante avance en la tecnología de generación de imágenes. El modelo se basa en un transformador de difusión lineal, utilizando un codificador de texto preentrenado y un codificador de características latentes comprimidas espacialmente, capaz de generar y modificar imágenes según indicaciones de texto. El código abierto de Sana se encuentra disponible en GitHub, ofreciendo amplias perspectivas de investigación y aplicación, especialmente en arte, herramientas educativas e investigación de modelos.