गूगल के एक शीर्ष वीडियो जनरेटिंग मॉडल Veo3 अब डेवलपर्स के लिए Gemini API के माध्यम से उपलब्ध है, जो टेक्स्ट से वीडियो बनाने के साथ-साथ संगत ध्वनि उत्पादन का समर्थन करता है। इस कदम ने AI वीडियो निर्माण के नए चरण में प्रवेश किया है, लेकिन इसके साथ अधिक लागत भी है।

Veo3 गूगल का पहला मॉडल है जो एकल टेक्स्ट प्रेरणा के माध्यम से उच्च रिज़ॉल्यूशन वीडियो बना सकता है और साथ ही बातचीत, संगीत और ध्वनि प्रभाव भी बना सकता है। वर्तमान में, Gemini API केवल टेक्स्ट से वीडियो बनाने के लिए उपलब्ध है, लेकिन गूगल कहता है कि Gemini एप्लिकेशन में उपलब्ध छवि से वीडियो समर्थन जल्द ही उपलब्ध हो जाएगा।

QQ20250718-085316.png

उन डेवलपर्स के लिए जो अपने ऐप्लिकेशन में उन्नत वीडियो जनरेशन क्षमता एम्बेड करना चाहते हैं या उत्पादन योग्य प्रोटोटाइप बनाना चाहते हैं, इस API एकरण एक मजबूत सहायता प्रदान करता है। Google AI Studio डेवलपर्स के लिए SDK टेम्पलेट और शुरुआती ऐप्लिकेशन प्रदान करता है जो उन्हें शुरू करने में मदद करता है। इस API तक पहुंचने के लिए एक सक्रिय Google Cloud परियोजना के साथ बिलिंग फीचर सक्षम होना आवश्यक है। गूगल ने खुलासा किया कि Veo3 कई मिलियन बार Gemini एप्लिकेशन, Flow और Vertex AI में उपयोग किया गया है।

हालांकि, Veo3 की कीमत AI वीडियो जनरेशन क्षेत्र में एक अपेक्षाकृत महंगा विकल्प बन गई है। Veo3 को Gemini API के माध्यम से केवल Google Cloud भुगतान योजनाओं में उपलब्ध कराया गया है। 720p, 24fps वीडियो (16:9 आवृत्ति ध्वनि के साथ) के लिए दर प्रति सेकंड 0.75 डॉलर है, जो ध्वनि रहित Veo2 से 25 सेंट अधिक है। इसका मतलब है कि आठ सेकंड के वीडियो के लिए 6 डॉलर की आवश्यकता होती है, जबकि पांच मिनट के वीडियो के लिए 225 डॉलर की आवश्यकता होती है। आमतौर पर आदर्श परिणाम प्राप्त करने के लिए कई प्रयास करने की आवश्यकता होती है, इसलिए वास्तविक लागत तेजी से बढ़ सकती है। उदाहरण के लिए, यदि पांच मिनट के उपयोगी वीडियो बनाने के लिए दस गुना सामग्री की आवश्यकता होती है, तो कुल लागत 2,250 डॉलर हो सकती है। हालांकि, गूगल को लगता है कि विशिष्ट उपयोग मामलों में, यह पारंपरिक वीडियो निर्माण की तुलना में अभी भी लाभदायक हो सकता है। गूगल ने "Veo3Fast" मोड की घोषणा भी की है, जो तेज और सस्ता है, लेकिन अभी तक API में उपलब्ध नहीं है।

वर्तमान में, Veo3 के उपयोग के मुख्य रूप से विशेषज्ञ क्षेत्र हैं। उदाहरण के लिए, Cartwheel Veo3 का उपयोग 2D वीडियो को वास्तविक 3D पात्र एनिमेशन में परिवर्तित करने के लिए करता है और उत्पन्न किए गए कार्यों को ग्राहक परियोजनाओं के असेंबली मॉडल पर मैप करता है। गेम स्टूडियो Volley