9 अक्टूबर को मास्क के स्वामित्व वाली xAI ने अपने नए वीडियो जनरेशन मॉडल Imagine v0.9 लॉन्च करने की घोषणा की, जो कंपनी के बहु-माध्यम AI रचनात्मकता के क्षेत्र में महत्वपूर्ण प्रगति को चिह्नित करता है। पुराने संस्करण v0.1 के साथ तुलना में, नया मॉडल छवि गुणवत्ता, गति स्वाभाविकता और ध्वनि उत्पादन के मामले में पूर्ण उछाल लाया है।
तीन मुख्य सुधार
दृश्य गुणवत्ता: छवि विशालता अधिक है, विवरण अधिक समृद्ध है, और समग्र गुणवत्ता व्यावसायिक फिल्म स्तर तक पहुंच गई है।
गति उत्पादन: व्यक्ति और स्थान की गति अधिक चिकनी और प्राकृतिक हो गई है, गति के संक्षेप में कोई बड़ा अंतर नहीं है।
ध्वनि क्षमता: मूल ध्वनि उत्पादन जोड़ा गया है, जो पृष्ठभूमि संगीत, बातचीत और गाने के साथ समान रूप से उत्पन्न कर सकता है।
एक क्लिक पर फिल्म स्तर के कार्य बनाएं
Imagine v0.9 तुरंत उत्पादन, कोई बाद के संपादन की आवश्यकता नहीं, पूर्ण वीडियो आउटपुट को संभव बनाता है, जो बुद्धिमान फ्रेमिंग, लेंस गति नियंत्रण आदि जैसे कार्यक्षमताओं का समर्थन करता है, जिससे रचनाकार कुछ सेकंड में फिल्म वर्णन के साथ छोटे या लंबे वीडियो बना सकते हैं।
मॉडल विशेषता कार्य
समकालिक ध्वनि प्रभाव: छवि और ध्वनि के फ्रेम-स्तर के मेल को बढ़ाएं, अंतर्निहित अनुभव को बढ़ाएं।
गतिशील कैमरा प्रभाव: ऑटोमैटिक बुद्धिमान फोकस, डीप ऑफ फ्यूजन समायोजन आदि फिल्म लैंग्वेज के समर्थन करता है।
प्राकृतिक बातचीत और गाना उत्पादन: कैरेक्टर अंग्रेजी में स्पष्ट और भावनात्मक रूप से समायोजित ध्वनि या गाना उत्पन्न कर सकते हैं।
नाच और रhythmic जांच: AI संगीत रिथ्म की शुद्धता से पकड़ लेता है, और समन्वित क्रियाकलाप उत्पन्न करता है।
xAI कहता है कि Imagine v0.9 के उत्पादन ने AI वीडियो रचनात्मकता के नए सीमा खोल दिए हैं, जिसमें उपयोगकर्ता टेक्स्ट प्रेरणा के साथ दृश्य वर्णन, ध्वनि प्रदर्शन और रिथ्म के साथ पूर्ण बहु-माध्यम कार्य तेजी से उत्पन्न कर सकते हैं।