कॉन्सीस्टोरी एक ऐसा तरीका है जो पूर्व-प्रशिक्षित पाठ-से-छवि मॉडल में सुसंगत विषयों को उत्पन्न करने में सक्षम है, बिना किसी प्रशिक्षण की आवश्यकता के। इसमें किसी भी फाइन-ट्यूनिंग या निजीकरण की आवश्यकता नहीं होती है, जिससे यह पिछले सर्वोत्तम तरीकों की तुलना में 20 गुना तेज़ है। हमने मॉडल को बेहतर बनाने के लिए विषय-संचालित साझा ध्यान मॉड्यूल और पत्राचार-आधारित विशेषता इंजेक्शन पेश किया है ताकि छवियों के बीच विषय सुसंगतता को बढ़ावा मिल सके। इसके अलावा, हमने विषय सुसंगतता बनाए रखते हुए लेआउट विविधता को प्रोत्साहित करने की रणनीति विकसित की है। कॉन्सीस्टोरी स्वाभाविक रूप से बहु-विषय परिदृश्यों में विस्तारित हो सकता है, और यहां तक ​​कि सामान्य वस्तुओं के लिए बिना प्रशिक्षण के निजीकरण भी प्राप्त कर सकता है।