Sana एक टेक्स्ट-टू-इमेज फ्रेमवर्क है जिसे NVIDIA द्वारा विकसित किया गया है, जो 4096×4096 पिक्सेल तक की उच्च रिज़ॉल्यूशन वाली छवियों को कुशलतापूर्वक उत्पन्न कर सकता है। यह मॉडल अद्भुत गति से उच्च रिज़ॉल्यूशन और उच्च-गुणवत्ता वाली छवियों को संश्लेषित करता है, और मज़बूत टेक्स्ट-टू-इमेज संरेखण क्षमता बनाए रखता है, जिसे लैपटॉप GPU पर तैनात किया जा सकता है। Sana मॉडल रैखिक प्रसार ट्रांसफ़ॉर्मर पर आधारित है, जो पहले से प्रशिक्षित टेक्स्ट एन्कोडर और स्थानिक रूप से संकुचित अव्यक्त विशेषता एन्कोडर का उपयोग करता है, जो इमोजी, चीनी और अंग्रेज़ी और मिश्रित संकेतों का समर्थन करता है।