AI छवि उत्पादन के क्षेत्र में, पारंपरिक पाठ संकेत विधि सामान्य हो गई है। हालाँकि, Google द्वारा पेश किया गया Whisk एक नया दृश्य प्राथमिकता दृष्टिकोण लाता है। यह उपयोगकर्ताओं को इनपुट के रूप में छवियों का उपयोग करके रचनात्मकता उत्पन्न करने और मिश्रण करने की अनुमति देता है, जिससे निर्माताओं को एक अधिक सहज और रचनात्मक छवि उत्पादन अनुभव मिलता है।

Hero_hmKlSP6.width-1600.format-webp.png

Whisk का परिचय

Whisk Google Labs द्वारा प्रस्तुत एक अभिनव जनरेटिव AI उपकरण है। यह Gemini और Imagen 3 मॉडल का उपयोग करके उपयोगकर्ता द्वारा इनपुट की गई छवियों के माध्यम से नए चित्र उत्पन्न करता है, जो विषय, दृश्य और शैली का प्रतिनिधित्व करते हैं। यह उपकरण मुख्य रूप से रचनात्मक अन्वेषण के लिए है, जिसका उद्देश्य उपयोगकर्ताओं को विभिन्न रचनात्मक विचारों को तेजी से उत्पन्न करने और पुनरावृत्त करने में मदद करना है, न कि सटीक छवि संपादन के लिए। वर्तमान में, Whisk केवल अमेरिका के उपयोगकर्ताओं (अमेरिकी IP) के लिए खुला है, उपयोगकर्ता इस उपकरण का उपयोग labs.google/whisk पर कर सकते हैं और प्रतिक्रिया दे सकते हैं।

截屏2024-12-17 下午3.45.28.jpg

Whisk की विशेषताएँ

  • छवि संचालित उत्पादन: उपयोगकर्ता छवियों को अपलोड करके विषय, दृश्य और शैली को निर्धारित कर सकते हैं, बजाय पाठ संकेतों के उपयोग के। यह उन उपयोगकर्ताओं के लिए एक आसान तरीका प्रदान करता है जो पाठ संकेत लिखने में असमर्थ हैं, जैसे कि उपयोगकर्ता एक बिल्ली की छवि को विषय के रूप में, एक कमल की पत्ते की छवि को दृश्य के रूप में, और चमकदार तत्वों वाली छवि को शैली के रूप में अपलोड करके अद्वितीय छवियाँ उत्पन्न कर सकते हैं।
  • स्वचालित विस्तृत कैप्शन उत्पन्न करना: Gemini मॉडल उपयोगकर्ता द्वारा अपलोड की गई छवियों के लिए स्वचालित रूप से विस्तृत कैप्शन विवरण लिखता है, जो Imagen 3 मॉडल में इनपुट किया जाता है, ताकि छवि की प्रमुख विशेषताओं को बेहतर तरीके से कैप्चर किया जा सके और उपयोगकर्ता की मंशा के अनुसार नई छवियाँ उत्पन्न की जा सकें।
  • रचनात्मक पुनर्मिश्रण: विभिन्न विषयों, दृश्यों और शैलियों की छवियों को पुनः मिश्रित करने की क्षमता, जैसे डिजिटल खिलौने, इनेमल पिन आदि विभिन्न रचनात्मक उत्पादों को बनाने के लिए।
  • स्वरूपण को पकड़ना न कि नकल करना: यह इनपुट छवियों की मूल विशेषताओं को पकड़ता है, न कि सटीक नकल करता है, जिससे उत्पन्न छवियों में अधिक रचनात्मक विविधता होती है, लेकिन यह भी हो सकता है कि परिणाम उपयोगकर्ता की अपेक्षाओं के साथ पूरी तरह से मेल न खा सके।
  • संशोधित संकेत: उपयोगकर्ता उत्पन्न छवियों को समायोजित और अनुकूलित करने के लिए अंतर्निहित संकेत जानकारी को देख और संपादित कर सकते हैं, जैसे रंग, पैटर्न आदि की विशेषताओं को बदलना।

截屏2024-12-17 下午3.50.10.jpg

उपयोग के मामले

  1. रचनात्मक डिजाइन: डिज़ाइनर Whisk का उपयोग करके विभिन्न डिज़ाइन दिशाओं का तेजी से अन्वेषण कर सकते हैं, विभिन्न संबंधित छवियों को अपलोड करके रचनात्मक प्रेरणा उत्पन्न कर सकते हैं, जैसे नए उत्पाद के लिए अद्वितीय दृश्य रूप का डिज़ाइन।
  2. कला निर्माण: कलाकार Whisk का उपयोग करके कला निर्माण के प्रारंभिक विचारों में मदद ले सकते हैं, विभिन्न तत्वों को छवि इनपुट के माध्यम से एकीकृत और प्रयास कर सकते हैं, जैसे एक फैंटसी थीम वाली पेंटिंग बनाना, संबंधित फैंटसी जीवों, दृश्यों आदि की छवियों को अपलोड करके रचनात्मक विचार प्राप्त करना।
  3. व्यक्तिगत उत्पाद अनुकूलन: व्यक्तिगत उत्पाद अनुकूलन उद्योगों के लिए, जैसे कस्टम बैज, स्टिकर आदि, Whisk उपयोगकर्ताओं को विभिन्न संभावित डिज़ाइन योजनाएँ तेजी से उत्पन्न करने में मदद कर सकता है, उपयोगकर्ताओं को केवल अपने पसंदीदा विषय, दृश्य और शैली की छवियों को अपलोड करना होगा, जिससे अद्वितीय कस्टम डिज़ाइन प्राप्त होगा।
  4. विज्ञापन विपणन: विज्ञापन योजनाकार Whisk का उपयोग करके विभिन्न रचनात्मक विज्ञापन सामग्री उत्पन्न कर सकते हैं, उत्पाद से संबंधित विषय की छवियों और ब्रांड छवि के अनुकूल दृश्यों और शैलियों की छवियों को अपलोड करके, आकर्षक विज्ञापन चित्र तेजी से प्राप्त कर सकते हैं, जो ऑनलाइन और ऑफलाइन विज्ञापन प्रचार के लिए उपयोग किया जा सकता है।
  5. शिक्षा क्षेत्र: शिक्षा में, शिक्षक Whisk का उपयोग करके शिक्षण में सहायता कर सकते हैं, जैसे कला कक्षा में, छात्रों को अपने रुचिकर वस्तुओं की छवियों को अपलोड करने के लिए प्रेरित करना, जिससे उनकी रचनात्मकता और कल्पना का विकास हो।

截屏2024-12-17 下午3.48.01.jpg

Whisk उपयोग गाइड

  1. उपकरण तक पहुँचें: अमेरिका के IP उपयोगकर्ता labs.google/whisk पर जाकर Whisk उपकरण पृष्ठ पर पहुँच सकते हैं।
  2. छवि अपलोड करें: आवश्यक चित्र सामग्री के अनुसार, विषय, दृश्य और शैली का प्रतिनिधित्व करने वाली छवियों को अपलोड करें। यदि उपयुक्त छवियाँ नहीं हैं, तो सुझाव छवियाँ प्राप्त करने के लिए डाइस आइकन पर क्लिक करें (ये छवियाँ भी AI द्वारा उत्पन्न हो सकती हैं)।
  3. छवि उत्पन्न करें: छवियाँ अपलोड करने के बाद, Whisk स्वचालित रूप से इन छवियों के आधार पर नई छवियाँ और संबंधित पाठ संकेत उत्पन्न करेगा।
  4. देखें और समायोजित करें: उत्पन्न छवियों को देखें, यदि संतुष्ट नहीं हैं, तो पाठ बॉक्स में संकेत जानकारी को संपादित करें, या छवि पर क्लिक करके उसकी संबंधित पाठ संकेत को संपादित करें ताकि छवि को समायोजित और अनुकूलित किया जा सके।
  5. डाउनलोड या संग्रहित करें: यदि उत्पन्न छवियों से संतुष्ट हैं, तो उन्हें डाउनलोड करके सहेजें, या भविष्य के उपयोग के लिए फ़ेवरेट्स में जोड़ें।

截屏2024-12-17 下午3.46.32.jpg

निष्कर्ष

Whisk एक अभिनव AI छवि उत्पन्न करने वाला उपकरण है, जो अपनी अद्वितीय छवि इनपुट विधि और रचनात्मक पुनर्मिश्रण कार्यक्षमता के साथ उपयोगकर्ताओं को एक नया रचनात्मक अनुभव प्रदान करता है। यह रचनात्मक डिजाइन, कला निर्माण, व्यक्तिगत उत्पाद अनुकूलन आदि कई क्षेत्रों में संभावित अनुप्रयोग मूल्य रखता है। हालाँकि, वर्तमान में यह केवल अमेरिका के उपयोगकर्ताओं के लिए खुला है और कुछ उत्पन्न परिणामों में पूर्णता की कमी हो सकती है, लेकिन यह दृश्य प्राथमिकता AI छवि उत्पादन दिशा का प्रतिनिधित्व करता है, जिस पर हमें ध्यान देने की आवश्यकता है।

यदि आप रचनात्मकता और AI छवि उत्पादन में रुचि रखते हैं, तो कृपया लाइक, टिप्पणी करें और Whisk के विकास पर नजर रखें, हमें उम्मीद है कि यह भविष्य में हमें और अधिक आश्चर्य और संभावनाएँ प्रदान करेगा।