हाल ही में, टेक मीडिया The Decoder ने रिपोर्ट की है कि गूगल डीपमाइंड ने एक नया Gemini2.5Flash छवि संपादन मॉडल लॉन्च किया है। इस सुधारित मॉडल ने Gemini ऐप में उपयोगकर्ताओं के लिए अधिक सटीक छवि संपादन अनुभव प्रदान किया है, जो छवि को वस्तुओं और जानवरों के बाहरी रूप को प्रभावित किए बिना शब्द निर्देशों के माध्यम से बड़े पैमाने पर संपादित करने की अनुमति देता है।
पिछले छवि जनरेशन टूल्स की तुलना में, Gemini2.5Flash जटिल शब्द निर्देशों के साथ उच्च शुद्धता के साथ काम करता है, और कई कार्यों में ChatGPT के उपयोग के GPT-4o से भी आगे रहा है। यह उन्नति छवि संपादन के दौरान उपयोगकर्ताओं के रचनात्मक विचारों को आसानी से वास्तविकता में बदलने में मदद करती है।
Gemini2.5Flash का एक उल्लेखनीय विशेषता "भूमिका संगतता" क्षमता है। भले ही बहुत सारी छवियां उत्पन्न की जाएं, उपयोगकर्ता द्वारा निर्दिष्ट व्यक्ति, जानवर या वस्तु के बाहरी रूप को समान रखा जाता है, चाहे आकृति, पृष्ठभूमि या प्रकाश के बदलाव हों। यह विशेषता ब्रांड के श्रृंखला फोटोग्राफ्स, उत्पाद के विभिन्न कोणों के प्रदर्शन के लिए विशेष रूप से मूल्यवान है, जो सामग्री और उत्पाद निर्देशिका बनाने की दक्षता में महत्वपूर्ण रूप से सुधार करता है।
इसके अलावा, Gemini2.5Flash अंशद्वारा सटीक शब्द संपादन समर्थन करता है, जिसमें उपयोगकर्ता को हस्तचिह्न चिह्नित करने की आवश्यकता नहीं होती है, बल्कि पृष्ठभूमि को अस्पष्ट करना, दोष दूर करना, रंग जोड़ना या वस्तु हटाना आदि विविध संपादन करना आसान हो जाता है। यह तीन छवियों के एक साथ संयोजन करने में भी सक्षम है, जैसे उत्पाद फोटो के साथ आंतरिक फोटो को एक वास्तविक दृश्य में जोड़ना। इसके अलावा, इसके पास "शैली स्थानांतरण" क्षमता है, जो एक टेक्स्चर, रंग या पैटर्न को दूसरी वस्तु पर लागू कर सकता है, जबकि आकृति और विवरण की अखंडता बनाए रखता है।
Gemini2.5Flash की "वास्तविकता तर्क" क्षमता पारंपरिक छवि संपादन की सीमाओं को अतिक्रमण करती है, जो सरल कारण-परिणाम संबंधों के मॉडलिंग के साथ अनुमति देती है, जैसे गुब्बारा खरपतवार के ऊपर उड़ने और बाद में परिणाम के चित्र बनाना। इन नवाचार क्षमताओं के कारण, Gemini2.5Flash एक शक्तिशाली छवि संपादन उपकरण के अलावा, उपयोगकर्ताओं के कल्पना को विकसित करने के लिए एक रचनात्मक मंच बन गया है।