स्टेपचार स्टार्स ने अपने 3डी महामॉडल स्टेप1X-3D को आधिकारिक रूप से जारी और ओपन सोर्स किया। इस मॉडल के निर्माण से श्रृंखला के पहलुओं पर नई पहल लगाई गई है, जिसके पश्चात इमेज, वीडियो, ध्वनि, संगीत जैसे मोडल के प्रयोग के बाद, यह AI तकनीक के अनुप्रयोगों की सीमाएँ और भी बढ़ाए जाती हैं।

स्टेप1X-3D मॉडल का कुल पैरामीटर कितना 4.8 बिलियन है, जिसमें जियोमेट्री मॉड्यूल 1.3 बिलियन और टेक्स्चर मॉड्यूल 3.5 बिलियन है। मजबूत डेटा आधार और उन्नत 3डी मॉड्यूल के साथ, यह मॉडल उच्च स्तर की जीवंतता और नियंत्रण वाले 3डी सामग्री का उत्पादन करने में सक्षम है। स्टेप1X-3D न केवल देखने में खूबसूरत होने पर जोर देता है, बल्कि "उपयोगी" और "नियंत्रित" को भी ध्यान में रखता है, और 3डी सामग्री उत्पादन के लिए मजबूत और विश्वसनीय तकनीक इंजन प्रदान करने का उद्देश्य है।

स्टेप1X-3D की मुख्य विशेषता यह है कि यह 3डी सामग्री उत्पादन के कुंजिपथों को सुलझा देता है। इसमें डेटा, उत्पादन जीवंतता और नियंत्रण पर नवीनताएं शामिल हैं। पहले, डेटा-ड्राइवन और एल्गोरिदम सहयोगी अपग्रेड करना यह मॉडल का आधार है। स्टेप1X-3D ने 5 मिलियन से अधिक मूल डेटा को खराब डेटा से बचाकर फ़िल्टर किया और एक मेज़बान डेटासेट बनाया, जिसमें 2 मिलियन उच्च गुणवत्ता और मानकीकृत ट्रेनिंग सेट है। इससे, उद्योग में डेटा की कमी और गुणवत्ता के विषम अनुपात की सीमाओं को व्यक्त किया जाता है। इसके द्वारा सुधार वाले मेज़बान-एसडीएफ ट्रांसफॉर्मेशन तकनीक के साथ, मॉडल के सीखने की सटीकता और अंतिम उत्पादन की कार्यक्षमता को सुरक्षित किया जाता है, जिससे पानी जैसे जीओमेट्री के ट्रांसफ़ॉर्म की सफलता 20% बढ़ जाती है, और स्टेप1X-3D की व्यापकता और विस्तारित विशेषताओं की क्षमता बढ़ जाती है।

वीसीएस_20250514161413.png

दूसरे, स्टेप1X-3D उन्नत 3डी जन्मजात दो-आधार आर्किटेक्चर का उपयोग करता है, जिससे जियोमेट्री और टेक्स्चर रिप्रेजेंटेशन को अलग किया जाता है, जिससे पूर्वानुमान न केवल देखने में खूबसूरत होता है, बल्कि संगठित और डाउनस्ट्रीम अनुप्रयोगों के लिए उपयोगी होता है। इससे जियोमेट्री की त्रुटि को बचाया जाता है, और उत्पादन की सटीकता, वास्तविकता और समानता को सुरक्षित किया जाता है। जियोमेट्री उत्पादन का केंद्र विशेष रूप से 3डी विशेषताओं के लिए अपग्रेड वैल्यू डिप्टी-डिएटी आर्किटेक्चर के साथ है, जिससे टीएसडीएफ आंतरिक प्रतिनिधित्व उत्पन्न किया जाता है, जिससे पूर्ण जियोमेट्री के साथ निर्माण किया जाता है, और अनिर्देशित बिंदुओं के लिए सुरक्षित होता है। इसके साथ ही, रिज़्ज़ एज नमूना जैसी तकनीकों का उपयोग किया जाता है, जिससे वस्तुओं के जियोमेट्री विस्तार को सटीक ढंग से पकड़ा जाता है और पुनर्निर्मित किया जाता है। टेक्स्चर उत्पादन में सिंगल्स्टीक्स एक्सएल मॉडल का उपयोग किया जाता है, जिसे विशेष रूप से अपग्रेड और ऑप्टिमाइज किया जाता है, जिससे जियोमेट्री मॉड्यूल के साथ प्रभावी सहयोग होता है। इससे उत्पादन के टेक्स्चर न केवल रंगमंडल में भरपूर होते हैं, बल्कि अच्छी गुणवत्ता वाले भावों का अनुभव भी होता है, और विभिन्न दृश्यों के बीच में अधिकतम समर्थन बनाए रखता है, जो जटिल तीन आयामी सतहों पर प्रायोगिक रूप से ठीक से जुड़ जाता है, और आम त्रुटियों जैसे विकृति और संधि दोषों से बचा जाता है।

अंत में, स्टेप1X-3D ने 3डी सामग्री उत्पादन की नियंत्रितता और उपयोग की लाभप्रदता को बढ़ा दिया है। VAE-डिफ्यूज़न के पूर्ण आर्किटेक्चर ने मुख्य 2डी उत्पादन मॉडल (जैसे स्टेबल डिफ्यूज़न) के साथ अनुरूपता का निर्माण किया है, जिससे उपयोगकर्ताओं को लाइटवेट लोरा माइक्रोट्यूनिंग जैसी उन्नत 2डी नियंत्रण तकनीकों को आसानी से इंटीग्रेट करने की सुविधा मिलती है। इससे, उपयोगकर्ता विभिन्न प्राप्ति की संभावना के साथ उत्पादन किए गए 3डी सामग्री की सममितता, सतह विवरण (जैसे, नाखूनी, सुस्पष्टता) आदि के गुणों को स्पष्ट और विस्तृत ढंग से नियंत्रित कर सकते हैं, जिससे उपयोगकर्ताओं की इरादे के सही रूप से प्रतिबिंबित किया जा सकता है।

स्टेपचार स्टार्स ने स्टेप1X-3D के वास्तविक प्रभाव को स्वचालित रूप से मूल्यांकन करने के लिए एक स्वयंसिद्ध इंटीग्रेटेड टेस्ट (जिसमें 110 विविध परीक्षण केस शामिल थे) बनाया और इसका कार्यकारी मूल्यांकन किया। इसके अलावा, यह बाज़ार में उपलब्ध कई मुख्य मॉडलों के साथ व्यापक तुलना की गई। परिणाम दर्शाते हैं कि, ऑटोमेटेड मूल्यांकन में, स्टेप1X-3D बहुत से कार्यक्षम डिमेंशन में बेहतरीन प्रदर्शन करता है। विशेष रूप से, CLIP-स्कोर नामक मुख्य इंडिकेटर में, स्टेप1X-3D ने सभी तुलना मॉडलों में सबसे ऊंचा स्कोर अर्जित किया, जो ओपन सोर्स कम्युनिटी को बहुत प्रतियोगिता वाली 3डी उत्पादन स्केल की पेशकश करता है।

GitHub:

https://github.com/stepfun-ai/Step1X-3D

HuggingFace:

https://huggingface.co/stepfun-ai/Step1X-3D

ModelScope:

https://www.modelscope.cn/models/stepfun-ai/Step1X-3D