26 अप्रैल 2025 को AIbase की रिपोर्ट: OpenAI ने हाल ही में घोषणा की है कि इसका प्रमुख बहु-मोडल मॉडल GPT-4o का इमेज जेनरेशन फ़ंक्शन अब आधिकारिक तौर पर ChatGPT के कस्टमाइज़्ड GPTs फ़ंक्शन में एकीकृत हो गया है। यह अपडेट इस बात का प्रतीक है कि उपयोगकर्ता द्वारा बनाए गए कस्टमाइज़्ड AI असिस्टेंट सीधे इमेज जेनरेट और एडिट कर सकते हैं, जिससे कंटेंट क्रिएशन, डिज़ाइन और शिक्षा जैसे क्षेत्रों में और अधिक संभावनाएँ खुलती हैं।

QQ_1745714143685.png

बिना किसी रुकावट के इमेज जेनरेशन का अनुभव

GPT-4o का इमेज जेनरेशन फ़ंक्शन पहले 25 मार्च 2025 से ChatGPT और Sora प्लेटफ़ॉर्म पर मुफ़्त, Plus, Pro और Team उपयोगकर्ताओं के लिए धीरे-धीरे उपलब्ध कराया गया था। पहले DALL-E3 जैसे बाहरी मॉडल पर निर्भरता के विपरीत, GPT-4o की इमेज जेनरेशन क्षमता मॉडल में ही अंतर्निहित है, जो टेक्स्ट प्रॉम्प्ट के आधार पर सीधे उच्च-गुणवत्ता वाली इमेज जेनरेट करने का समर्थन करती है। अब, यह फ़ंक्शन कस्टमाइज़्ड GPTs तक विस्तारित हो गया है, उपयोगकर्ता ChatGPT के कस्टमाइज़्ड GPT एडिटर के माध्यम से "GPT-4o Image Generation" विकल्प को सक्षम करके इमेज जेनरेशन क्षमता वाला अपना विशेष AI असिस्टेंट बना सकते हैं। इस अपडेट ने मौजूदा DALL-E3 बैकएंड को बदल दिया है, जिससे जेनरेशन की गति और इमेज की गुणवत्ता में उल्लेखनीय सुधार हुआ है।

फ़ंक्शन की खासियतें और उपयोग के क्षेत्र

कस्टमाइज़्ड GPTs में GPT-4o इमेज जेनरेशन की शक्तिशाली लचीलापन और व्यावहारिकता दिखाई देती है। उपयोगकर्ता प्राकृतिक भाषा प्रॉम्प्ट के माध्यम से फ़ोटो जैसी वास्तविकता वाली इमेज, स्टाइलिश इलस्ट्रेशन या जटिल डिज़ाइन एसेट जेनरेट कर सकते हैं। यहाँ इसके मुख्य लाभ दिए गए हैं:

सटीक टेक्स्ट रेंडरिंग: GPT-4o इमेज में स्पष्ट रूप से पढ़े जा सकने वाले टेक्स्ट को सटीक रूप से एम्बेड कर सकता है, जो चार्ट, मेनू, निमंत्रण पत्र या इन्फ़ोग्राफ़िक जैसी सामग्री जेनरेट करने के लिए उपयुक्त है।

मल्टी-राउंड इंटरैक्शन ऑप्टिमाइज़ेशन: उपयोगकर्ता बातचीत के माध्यम से इमेज के विवरण को चरणबद्ध तरीके से समायोजित कर सकते हैं, मॉडल संदर्भ की स्थिरता बनाए रख सकता है, जो कि चरित्र डिज़ाइन, ब्रांड एसेट डेवलपमेंट या स्टोरीबोर्ड निर्माण जैसे कई पुनरावृत्तियों की आवश्यकता वाले परिदृश्यों के लिए उपयुक्त है।

जटिल निर्देशों का पालन: मॉडल 10 से 20 ऑब्जेक्ट वाले विस्तृत प्रॉम्प्ट को संभाल सकता है, ऑब्जेक्ट के संबंध और विशेषताओं की सटीक प्रस्तुति सुनिश्चित करता है।

विभिन्न प्रकार की शैलियों का अनुकूलन: यथार्थवादी से कार्टून, हाथ से बनाए गए से उच्च रिज़ॉल्यूशन तक, GPT-4o कई कला शैलियों की इमेज जेनरेट कर सकता है, जो विभिन्न रचनात्मक आवश्यकताओं को पूरा करता है।

उदाहरण के लिए, फैशन क्षेत्र का कस्टमाइज़्ड GPT कपड़ों के डिज़ाइन के स्केच जेनरेट कर सकता है, शिक्षा क्षेत्र का GPT सहज ज्ञान युक्त शिक्षण चार्ट बना सकता है, और मार्केटिंग क्षेत्र का GPT सोशल मीडिया विज्ञापन सामग्री को तेज़ी से जेनरेट कर सकता है। ये फ़ंक्शन उपयोगकर्ताओं को उच्च-गुणवत्ता वाली दृश्य सामग्री प्राप्त करने का एक तरीका प्रदान करते हैं, बिना किसी पेशेवर डिज़ाइन कौशल की आवश्यकता के।

उपयोग करने का तरीका और सीमाएँ

GPT-4o के इमेज जेनरेशन फ़ंक्शन का उपयोग करने के लिए, उपयोगकर्ताओं को ChatGPT के कस्टमाइज़्ड GPT एडिटर में संबंधित विकल्प को सक्षम करना होगा, और टेक्स्ट प्रॉम्प्ट के माध्यम से आवश्यक इमेज का वर्णन करना होगा, जैसे रंग कोड, पहलू अनुपात या पारदर्शी पृष्ठभूमि जैसे विवरण निर्दिष्ट करना होगा। जेनरेशन प्रक्रिया में कुछ सेकंड से लेकर एक मिनट तक का समय लग सकता है, जो प्रॉम्प्ट की जटिलता पर निर्भर करता है। हालाँकि यह फ़ंक्शन शक्तिशाली है, लेकिन वर्तमान कार्यान्वयन में कुछ सीमाएँ हैं। उदाहरण के लिए, कुछ उपयोगकर्ताओं ने बताया है कि कस्टमाइज़्ड GPT निर्देशों का पालन करने में इमेज जेनरेशन की स्थिरता लगभग 50% है, जो दर्शाता है कि यह फ़ंक्शन अभी भी प्रायोगिक चरण में है। इसके अलावा, पोस्टर जैसी बड़ी इमेज में क्रॉपिंग समस्याएँ हो सकती हैं, जिन्हें आगे अनुकूलित करने की आवश्यकता है। OpenAI का कहना है कि वह फ़ंक्शन की स्थिरता और प्रदर्शन को बेहतर बनाने के लिए लगातार अपडेट जारी करेगा।

व्यापक पहुँच और सुरक्षा

वर्तमान में, GPT-4o इमेज जेनरेशन फ़ंक्शन ChatGPT के सभी सब्सक्रिप्शन स्तरों के लिए उपलब्ध है, जिसमें मुफ़्त उपयोगकर्ता (प्रतिदिन 3 बार की सीमा) भी शामिल हैं। उम्मीद है कि आने वाले हफ़्तों में कॉर्पोरेट, शिक्षा उपयोगकर्ताओं और API डेवलपर्स को पहुँच मिल जाएगी। सामग्री की सुरक्षा सुनिश्चित करने के लिए, सभी जेनरेट की गई इमेज में स्रोत को इंगित करने के लिए C2PA मेटाडेटा एम्बेड किया गया है, OpenAI ने आंतरिक खोज उपकरण और ऑडिट सिस्टम भी तैनात किए हैं, जो वास्तविक लोगों, नग्नता या हिंसा से संबंधित सामग्री के जेनरेशन को सख्ती से प्रतिबंधित करते हैं।

डेवलपर्स पर गहरा प्रभाव

डेवलपर्स के लिए, GPT-4o इमेज जेनरेशन API के आगामी लॉन्च से इसके अनुप्रयोगों में एकीकरण को और बढ़ावा मिलेगा। पारंपरिक इमेज जेनरेशन मॉडल की तुलना में, GPT-4o का बहु-मोडल आर्किटेक्चर मॉडल के बीच स्विचिंग लागत को कम करता है, जिससे एक अधिक सहज विकास अनुभव मिलता है। यह अपडेट यह भी दर्शाता है कि OpenAI ChatGPT, Sora और API के बीच एक एकीकृत बहु-मोडल तकनीकी स्टैक के निर्माण पर काम कर रहा है, भविष्य में व्यापक फ़ंक्शन विस्तार की उम्मीद है।

भविष्य की संभावनाएँ

कस्टमाइज़्ड GPTs में GPT-4o इमेज जेनरेशन फ़ंक्शन का उपयोग न केवल AI असिस्टेंट की व्यावहारिकता को बढ़ाता है, बल्कि उपयोगकर्ताओं को अधिक सहज और कुशल रचनात्मक उपकरण भी प्रदान करता है। हालाँकि निर्देशों के पालन की स्थिरता और इमेज क्रॉपिंग समस्याओं जैसी कुछ तकनीकी चुनौतियों को हल करने की आवश्यकता है, लेकिन इसकी क्षमता स्पष्ट है। AIbase का अनुमान है कि जैसे-जैसे OpenAI मॉडल को लगातार अनुकूलित करेगा और API पहुँच का विस्तार करेगा, GPT-4o कंटेंट क्रिएशन, व्यावसायिक डिज़ाइन और शिक्षा क्षेत्र में बड़ा बदलाव लाएगा। AIbase GPT-4o की नवीनतम प्रगति पर नज़र रखेगा और आपको अत्याधुनिक AI तकनीक की गहन अंतर्दृष्टि प्रदान करेगा।