हाल ही में आईपीजी (आर्टिफिशियल इंटेलिजेंस) वीडियो जनरेशन क्षेत्र में, टिकटॉक के माता कंपनी ByteDance ने एक नया मॉडल 'Seedance1.0' को गुप्त रूप से लॉन्च किया है। इस मॉडल ने स्वतंत्र टेस्टिंग में Google के हाल के Veo3 से अधिक प्रदर्शन किया है। Veo3 ने ऑडियो सिंथेसिस और मोशन पिक्चर-जैसे उपकरणों के लिए बहुत ज्यादा ध्यान आकर्षित किया, लेकिन Seedance1.0 की प्रौद्योगिकी का शक्तिशाली प्रदर्शन देखकर लोग आश्चर्यचकित हुए हैं, और यह वीडियो जनरेशन के क्षेत्र में एक पहलवान बन गया है।
Seedance1.0 के अनुसंधान पेपर में इस मॉडल के नवीनताओं के बारे में विस्तार से बताया गया है। ByteDance की टीम ने स्थानिक और समयांतरिक परतों के डिकपलिंग का उपयोग किया है, जिसके साथ मल्टीमोडल पोझिशनल कोडिंग को जोड़ा गया है, जिससे यह मॉडल टेक्स्ट से वीडियो और इमेज से वीडियो जनरेशन के कार्य को एक साथ प्रबंधित कर सकता है। ऐसी तकनीक संकल्पना और बहुल कैमेरा नेस्टिंग का समर्थन करती है, जो निरंतर विषय के प्रदर्शन को बनाए रखती है।
इसके अलावा, Seedance1.0 के प्रदर्शन के पीछे ByteDance का मजबूत डेटा पाइपलाइन है। टीम ने एक बड़े परिमाण का, बहु स्रोतों से जुड़े डेटासेट का निर्माण किया है, जिसमें विस्तृत द्विभाषी नोटेशन और विस्तृत गति और स्थिर विशेषताओं का लेबलिंग किया गया है, जिससे जनरेट की गई सामग्री की सटीकता बढ़ जाती है। इसके साथ ही, एक नवीन अभिप्रेरणा सीखने की सेटिंग का उपयोग किया गया है, जिसमें तीन रिवार्ड मॉडल्स का उपयोग किया गया है, जो बेसिक अंतर्निहित अंतर्निहित अंतर्निहित, गति की गुणवत्ता और लुभावनीयता पर ध्यान केंद्रित करते हैं।
टेस्टिंग में, Seedance1.0 ने Veo3 की तुलना में कई आयामों पर अधिक प्रदर्शन किया। फिल्म निर्माता के साथ सहयोग से विकसित SeedVideoBench बेंचमार्क परीक्षण में, यह मॉडल टिप्पणी का पालन करने और गति की वास्तविकता के लिए उच्च स्कोर प्राप्त किए हैं। इमेज से वीडियो की तकनीक में, Seedance ने इनपुट फ्रेम की दृश्य संगतता को बनाए रखा, जबकि Veo3 के कुछ मामलों में प्रकाशन और टेक्स्टर परिवर्तन होने की समस्या रही।
इन्फरेंस प्रदर्शन के क्षेत्र में, Seedance1.0 भी अच्छा प्रदर्शन किया है। यह मॉडल 1080p के पांच सेकंड के वीडियो को 41.4 सेकंड में बना सकता है, जो इसकी प्रतिद्वंद्वियों जैसे Sora, Runway Gen-4 और Veo3 से बहुत अधिक तेज है। ByteDance ने बताया है कि उन्होंने लागत और देरी में महत्वपूर्ण प्रगति की है, जिससे वीडियो जनरेशन को रियल-टाइम एप्लिकेशन की ओर बढ़ाने में मदद मिली है।
Seedance1.0 को 2025 के जून में Doubao और Jimeng जैसी प्लेटफॉर्मों में एकीकृत किया जाने वाला है, जिसका उद्देश्य व्यावसायिक कार्यप्रवाह को सुधारने और सामान्य निर्माण कार्यों को बेहतर बनाने की योजना है। हालांकि, Veo3 ने पहली बार सच्चे वीडियो के साथ वाइड्स और डायलॉग के संयोजन के लिए बहुत ज्यादा ध्यान आकर्षित किया है, लेकिन Seedance1.0 ने दृश्य निर्मिति, गति की स्थिरता और निबंध की जुड़वांता में अधिक शक्ति दिखाई है, हालांकि इसकी ऑडियो क्षमता में कमी है।
चिंह लगाएं:
🌟 Seedance1.0 का प्रकाशन Google के Veo3 से बेहतर प्रदर्शन करके वीडियो जनरेशन तकनीक का नया मानक बन गया है।
⚙️ यह मॉडल जटिल स्थानांतरण और बहु कैमेरा नेस्टिंग को समर्थित करने के लिए मल्टीमोडल पोझिशनल कोडिंग का उपयोग करता है।
⚡ Seedance1.0 ने जनरेट की गति और दृश्य संगतता पर अच्छा प्रदर्शन किया है, जिससे यह 2025 में व्यावसायिक निर्माण के लिए महत्वपूर्ण उपकरण बनने की संभावना है।