AI उपकरणों के क्षेत्र में एक और बड़ा उथल-पुथल! Google AI Studio ने आज एक बड़ा धमाका किया है, इसके नवीनतम अपग्रेडेड फीचर ने X प्लेटफॉर्म पर टेक जगत में तहलका मचा दिया है। यूज़र्स हैरान हैं, Google AI Studio अब सीधे YouTube वीडियो लिंक को "खा" सकता है, डाउनलोड या अपलोड करने की ज़रूरत नहीं, वीडियो की सामग्री को तुरंत समझ लेता है! और भी हैरान करने वाली बात यह है कि Gemini2.0Flash Experimental मॉडल (जिसे आगे Gemini2.0Flash exp कहा जाएगा) ने चुपके से प्राकृतिक इमेज जनरेशन की कला को अनलॉक कर दिया है, और कई तस्वीरों में पात्रों को "आत्मा के रूप में" एकरूपता बनाए रखने में भी सक्षम है! इस "आधिकारिक तौर पर एप्लिकेशन बनाने" वाले बड़े अपडेट को उद्योग के विशेषज्ञों ने "सबसे घातक" डिमोशन हमला माना है, जिससे "शेल" तकनीक पर निर्भर कई AI छोटे टूल के लिए उनके "अंत" का संकेत मिलता है।
X प्लेटफॉर्म के यूज़र interjc ने आज एक पोस्ट में हैरानी व्यक्त करते हुए लिखा है: "Google AI Studio अब वीडियो सामग्री को समझने के लिए सीधे YouTube लिंक पेस्ट कर सकता है, कई 'शेल' छोटे टूल फिर से गिरने वाले हैं।" उन्होंने तीखे शब्दों में कहा कि इस नए फीचर के जुड़ने से "डिमोशन हमला" हुआ है, यूज़र्स को वीडियो डाउनलोड करने और अपलोड करने की ज़रूरत नहीं है, सीधे लिंक डालकर सवाल पूछ सकते हैं या सारांश प्राप्त कर सकते हैं, दक्षता में कई गुना बढ़ोतरी हुई है। और भी आश्चर्यजनक बात यह है कि बिना सबटाइटल वाले वीडियो भी Gemini2.0Flash exp आसानी से समझ लेता है, सामग्री का तेज़ी से विश्लेषण करता है, यह एक "अद्भुत उपकरण" है। यूज़र jesselaunz ने एक बिना सबटाइटल वाले चीनी वीडियो का परीक्षण किया, और Gemini2.0Flash exp ने वीडियो सामग्री का "बेहतरीन सारांश" दिया, अन्य बड़े मॉडल से कहीं बेहतर, इसे "अद्वितीय तकनीक" कहा जा सकता है, अन्य AI इसके सामने फीके पड़ जाते हैं।
अगर वीडियो समझ "प्री-डिनर स्नैक्स" है, तो Gemini2.0Flash exp में इमेज जनरेशन के क्षेत्र में हुआ विकास "परमाणु बम" जैसा है। X यूज़र dotey ने प्लेटफॉर्म पर एक प्रभावशाली स्क्रीन रिकॉर्डिंग शेयर की, उन्होंने "कछुआ और खरगोश की दौड़" को कीवर्ड के रूप में इस्तेमाल करते हुए, एक साथ 8 दृश्य चित्र बनाए, परिणाम आश्चर्यजनक थे! बनाई गई तस्वीरें न केवल प्राकृतिक और सहज थीं, बल्कि और भी आश्चर्यजनक बात यह थी कि "कछुआ" और "खरगोश" के पात्रों में "आत्मा" जैसी एकरूपता थी, 8 तस्वीरों में उनके चेहरे के लक्षण एक जैसे थे! और भी आश्चर्यजनक बात यह थी कि पहली तस्वीर में चीनी में "कछुआ और खरगोश की दौड़" चार बड़े अक्षर भी थे, हालांकि ध्यान से देखने पर स्ट्रोक में थोड़ी खामी थी, लेकिन यह क्षमता अभी भी आश्चर्यजनक है। dotey ने उत्साह से कहा: "यह गति बहुत तेज है, यह सभी 'शेल' टूल को पूरी तरह से मात देती है!"
X प्लेटफॉर्म पर चर्चा का जोश लगातार बढ़ रहा है, Gemini2.0Flash exp की शक्तिशाली क्षमता न केवल मल्टी-मोडल प्रोसेसिंग क्षमता में है, बल्कि इसकी आश्चर्यजनक जनरेशन गति और असाधारण स्थिरता में भी है। यूज़र python_xxt ने एक घंटे से ज़्यादा लंबे बिना सबटाइटल वाले वीडियो लिंक का परीक्षण किया, Gemini2.0Flash exp "सीधे मीटिंग की सामग्री और गहन विश्लेषण दे सकता है, बाजार में मौजूद सभी सारांश टूल को मात देता है", यह "अद्भुत" है। इस फीचर का उपयोग वीडियो सामग्री की गहन समझ से संभव हुआ है, बिना सबटाइटल के भी वीडियो की मुख्य जानकारी को सटीक रूप से निकाल सकता है, इसकी तकनीकी क्षमता स्पष्ट है।
उद्योग के विशेषज्ञों ने यह देखा है कि Google AI Studio के इस अपडेट से इसकी विकास रणनीति में बड़ा बदलाव आया है - केवल बेसिक मॉडल प्लेटफॉर्म से, एप्लिकेशन-स्तरीय टूल में तेज़ी से विकास। X यूज़र gantrols ने स्पष्ट रूप से कहा कि Gemini2.0Flash exp का इमेज जनरेशन फीचर चीनी प्रॉम्प्ट और संवाद संशोधन का पूरी तरह से समर्थन करता है, जिससे यूज़र्स के लिए इसका उपयोग करना बहुत आसान हो गया है। उन्होंने एक उपयोगी गाइड भी दिया, "AI Studio पर जाकर मॉडल चुनें", इससे Google द्वारा डेवलपर्स के प्रति मित्रतापूर्ण रवैये का पता चलता है।
निश्चित रूप से, नए फीचर उत्साहजनक हैं, लेकिन कुछ यूज़र्स ने इसकी कमियों को भी बताया है। उदाहरण के लिए, dotey ने देखा कि Gemini2.0Flash exp द्वारा बनाए गए चीनी अक्षरों में अभी भी कुछ छोटी-छोटी खामियाँ हैं। यूज़र Lessnoise365 ने भी कहा कि इसी तरह के फीचर पहले से ही Pixel फोन के Gemini में मौजूद हैं, AI Studio का मुफ़्त लाभ निश्चित रूप से अच्छा है, लेकिन उपयोग में आसानी के मामले में, इसमें और सुधार की गुंजाइश है। हालाँकि, कमियाँ इसकी खूबियों को नहीं छिपा सकतीं, X प्लेटफॉर्म के यूज़र्स का मानना है कि इस अपडेट का मौजूदा AI टूल इकोसिस्टम पर गहरा प्रभाव पड़ेगा, खासकर उन "शेल" एप्लिकेशन पर जो साधारण पैकेजिंग पर निर्भर हैं, उन्हें बड़ी चुनौतियों का सामना करना पड़ेगा।
Google ने अभी तक Gemini2.0Flash exp के तकनीकी विवरणों की आधिकारिक घोषणा नहीं की है, लेकिन इसकी आश्चर्यजनक मल्टी-मोडल क्षमता और उच्च दक्षता ने पूरे उद्योग में बड़ी उम्मीदें जगाई हैं। AI Studio के लगातार अपडेट के साथ, क्या Google अपने विशाल इकोसिस्टम संसाधनों को एकीकृत करेगा और और भी क्रांतिकारी AI फीचर लॉन्च करेगा, यह 2025 में AI क्षेत्र का सबसे महत्वपूर्ण पहलू होगा।
API पता:
https://ai.google.dev/gemini-api/docs/vision?lang=python&hl=zh-cn#youtube