मिडजर्ने ने अपना पहला AI वीडियो उत्पादन मॉडल V1 को आधिकारिक रूप से लॉन्च किया, जो इसके छवि उत्पादन के लिए प्रसिद्ध कंपनी को एक नई चर्चा के प्राथमिक मिमान में ले जाता है। विश्व के शीर्ष स्तरीय AI क्रिएटिव प्लेटफॉर्म के रूप में, मिडजर्ने के इस प्रकाशन ने डिजिटल कला और वीडियो कलाकारों के बीच व्यापक ध्यान आकर्षित किया है। इस लेख को AIbase संपादकीय दल ने सबसे हालिया ऑनलाइन जानकारी संग्रहित करके आपको V1 मॉडल के मुख्य बिंदु और भविष्य की क्षमताओं के बारे में विस्तार से समझाने का प्रयास किया है।

स्थिर से गतिशील: V1 मॉडल के केंद्रीय फ़ंक्शन
मिडजर्ने V1 वीडियो उत्पादन मॉडल की वैशिष्ट्यात्मक सुविधा "छवि से वीडियो (Image-to-Video, I2V)" है। उपयोगकर्ता अपने वेब पेज के "अनिमेट" बटन का उपयोग करके स्थिर छवि को गतिशील वीडियो में बदल सकते हैं। प्रत्येक उत्पादन प्रोसेस में पांच सेकंड का वीडियो प्राप्त होता है, और प्रत्येक बार चार विभिन्न स्टाइल के वीडियो के टुकड़े उत्पादित किए जाते हैं, जिसमें से उपयोगकर्ता सबसे उपयुक्त संस्करण का चयन कर सकता है। इसके अलावा, वीडियो की लंबाई 4 सेकंड के वृद्धि के साथ अधिकतम 20 सेकंड तक बढ़ाई जा सकती है।
V1 की दो गतिशीलता मोड:
लो डायनेमिक मोड: इसे पर्यावरणीय स्थितियों के लिए उपयुक्त माना जाता है, कैमेरा स्थिर रहता है और विषय धीरे-धीरे या जानबूझ कर गतिशील होता है, जो डूबों भावना पैदा करता है।
हाई डायनेमिक मोड: इसे रफ्तार वाली स्थितियों के लिए उपयोगी होता है, जो बेहद प्रभावशाली दृश्य प्रभाव पैदा करता है।
उपयोगकर्ता आत्मनिर्णयीय गतिशीलता मोड का उपयोग कर सकता है, जो AI द्वारा गतिशीलता का निर्णय करता है, या टेक्स्ट प्रमाण के माध्यम से मैनुअल निर्देशित कर सकता है, जिससे वीडियो की क्रिएटिव दिशा और गतिशीलता के रूप में अतिरिक्त सुधार किए जा सकते हैं। मिडजर्ने ने इसका कहना है कि V1, इसके छवि मॉडल V6.1 की उच्च सामंजस्यता को जारी रखता है, जिससे उत्पादित वीडियो की विस्तृत विशेषताएं और स्टाइल में उत्कृष्ट गुणवत्ता बनी रहती है।
उपयुक्त कीमत, व्यापक कलाकारों के लिए
मिडजर्ने का लक्ष्य कम लागत और उच्च अभिगम दर है, और V1 मॉडल की कीमत नीति उसके अनुगामी स्वार्थपूर्ण शैली को जारी रखती है। बेसिक प्लान (10 डॉलर/महीना) से वीडियो उत्पादन का अनुभव हो सकता है, जबकि प्रो प्लान (60 डॉलर/महीना) और मेगा प्लान (120 डॉलर/महीना) के उपयोगकर्ताओं को "रिलैक्स" मोड में बेहतरीन वीडियो उत्पादन की सुविधा मिलेगी। हालांकि, वीडियो उत्पादन का कम्प्यूटेशनल कार्यक्षमता छवि उत्पादन की तुलना में लगभग 8 गुना अधिक होती है, इसलिए उपयोगकर्ता अपने मासिक क्वोटा को विचारपूर्वक प्लानिंग करने चाहिए।
इस समय, मिडजर्ने ने वीडियो के सुपररेझोल्यूशन एनचेंजमेंट या ऑडियो उत्पादन की सुविधा नहीं प्रदान की है, और वर्तमान में आउटपुट रिज़ॉल्यूशन 480p है, फ्रेम रेट 24 फ्रेम प्रति सेकंड है। हालाँकि, इसकी विशेषताओं में विभिन्न प्रतियोगियों (जैसे, रनवे जेन-4, लूमा ड्रीम मशीन या ओपनएआई के सोरा) की तुलना में कुछ मूल्यवर्ग होने के कारण भी, इसकी निम्न प्रवेश दर और ऊंची गुणवत्ता वाली दृश्य शैली इसे बाजार में एक विशेष स्थान दिया है।
भविष्य की दिशा: मिडजर्ने का बड़ा दृष्टिकोण
मिडजर्ने के सीईओ डेविड हॉल्ट्ज ने ब्लॉग में कहा, V1 मॉडल उनके रियल-टाइम ओपन वर्ल्ड सिमुलेशन के लक्ष्य की एक महत्वपूर्ण चरण के रूप में है। हॉल्ट्ज ने जोर देते हुए कहा कि मिडजर्ने ने बेहतरीन कलाकारों या विज्ञापन उद्योग के लिए सिम्पल बी-रोल सामग्री उत्पादन की तुलना में इंटरैक्टिव 3डी सिमुलेशन बनाने वाले AI मॉडलों को बनाने पर ध्यान केंद्रित किया है।
"हमें छवियों की जरूरत है (छवि मॉडल), हमें छवियों को गति देने की जरूरत है (वीडियो मॉडल), यह भविष्य के लिए पथप्रदर्शन है," वो कहते हैं।
V1 का प्रकाशन न केवल प्रौद्योगिकी में अग्रगति को दर्शाता है, बल्कि मिडजर्ने के इकोसिस्टम में नई ऊर्जा भी लाए है। इसके साथ ही लॉन्च किए गए V7 टेक्स्ट-टू-इमेज मॉडल के साथ, उपयोगकर्ता टेक्स्ट से इमेज उत्पादित कर सकते हैं, फिर उसे वीडियो में परिवर्तित कर सकते हैं, जो कि पूरी तरह से क्रिएटिव लूप को पूरा करता है। यह एंड-टू-एंड क्रिएटिव प्रक्रिया स्वतंत्र कलाकारों, डिजिटल कलाकारों और छोटे और मध्यम व्यवसायों के लिए कार्यकुशल उपकरण प्रदान करती है।
चुनौतियाँ और विवाद: कॉपीराइट सूचना का छाया