AIbase基地
द्वारा प्रकाशितAI समाचार · 9 मिनट पढ़ें · May 13, 2025 < p > बाइटडांप (ByteDance) ने हग्गिंग फेस (Hugging Face) प्लेटफॉर्म पर एक नया छवि कस्टमाइज़ेशन फ्रेमवर्क 'ड्रीमो' (DreamO) को ऑपन सोर्स किया है। यह फ्रेमवर्क मल्टीपल फंक्शनलिटीज़ के साथ आता है, जिसमें छवि कपड़े बदलने, साइज ढांचे में बदलने, शैली ट्रांसफर और कई प्रधानताओं का संयोजन शामिल है, जिससे AI छवि संपादन के क्षेत्र में नई तकनीकी अग्रगति हुई है। AIबेस (AIbase) संपादक दल ने सबसे नया जानकारी को संग्रहीत किया है और ड्रीमो के मुख्य खासगियों और उसके उद्योग में संभावित प्रभाव को विस्तार से विश्लेषित किया है। < /p >
< p style = "text-align:center" > < img src = "https://upload.chinaz.com/2025/0513/6388272564419034783487193.png" title = "QQ_1747100036214.png" alt = "QQ_1747100036214.png" /> < /p >
< p > < strong > फ्रेमवर्क खासगियाँ: एक-स्टॉप छवि कस्टमाइज़ेशन समाधान
< p > ड्रीमो को एक एकीकृत छवि कस्टमाइज़ेशन फ्रेमवर्क के रूप में डिज़ाइन किया गया है, जो विभिन्न प्रकार की संपादन कार्यों का समर्थन करता है और सुसंगत पैरामीटर सेटिंग के माध्यम से लगातार संयोजन करता है। अधिकारियों के अनुसार, ड्रीमो डिफ्यूज़न ट्रांसफॉर्मर (DiT) छवि मॉडल पर आधारित है, जो जटिल छवि संपादन की आवश्यकताओं को प्रभावी ढंग से प्रबंधित करता है। इस फ्रेमवर्क में निम्नलिखित मुख्य फ़ंक्शनलिटीज़ शामिल हैं:
< ul >
< li > कपड़ा बदलना और वस्तु संपादन: IP (आइटम प्रॉम्प्ट) पैरामीटर के माध्यम से, उपयोगकर्ता व्यक्तियों, कपड़ों या वस्तुओं को सटीक रूप से बदल सकते हैं, पृष्ठभूमि को स्वचालित रूप से हटा दिया जाता है ताकि प्रधान वस्तु को जोकर्म किया जा सके।
< li > चेहरा बदलना और सामान्यता: ID पैरामीटर चेहरे के क्षेत्र के लिए डिज़ाइन किया गया है, प्रायः PuLID तकनीक के समान, जो चेहरे को बदलने के बाद व्यक्ति की चेहरे की विशेषताओं को बहुत अधिक सामान्य बनाती है।
< li > शैली ट्रांसफर: Style पैरामीटर के माध्यम से, उपयोगकर्ता पृष्ठभूमि को बचाए रख सकते हैं और शैली को ट्रांसफर कर सकते हैं, बस प्रोम्प्ट के सामने "इसी शैली के छवि बनाएं" जैसे शब्दों को जोड़ने से शैली टास्क का सक्रियण हो जाएगा।
< li > बहुत से प्रधानताओं का संयोजन: बहुत से प्रधानताओं के फ्यूजन संपादन का समर्थन करता है, जो जटिल स्थितियों की निर्माण की आवश्यकताओं को पूरा करता है।
< /p >
< p > ड्रीमो के एक-स्टॉप डिज़ाइन ने उपयोगकर्ताओं के उपयोग के बड़े बंदरबंद को कम कर दिया है, चाहे वे पेशेवर डिज़ाइनर हों या सामान्य उपयोगकर्ता हों, वे साधारण पैरामीटर सेटिंग के माध्यम से उच्च गुणवत्ता वाली छवि संपादन परिणाम प्राप्त कर सकते हैं। < /p >
< p style = "text-align: center;" > < img src = "https://upload.chinaz.com/2025/0513/6388272567076043015636571.png" title = "QQ_1747100061672.png" alt = "QQ_1747100061672.png" /> < /p >
< p > < strong > तकनीकी नवाचार: लचीलपन और संगतता के एक साथ
< p > ड्रीमो का प्रकाशन बाइटडांप (ByteDance) के AI छवि उत्पादन क्षेत्र में गहरे अनुभवों को प्रदर्शित करता है। परंपरागत छवि संपादन उपकरणों की तुलना में, ड्रीमो विभिन्न कार्यों का एकीकृत फ्रेमवर्क पेश करता है, जो उपयोगकर्ताओं को अलग-अलग उपकरणों के बीच आसानी से स्विच करने की जटिल प्रक्रिया को रोकता है। IP, ID, और Style के तीन पैरामीटरों का डिज़ाइन न केवल उच्च लचीलपन प्रदान करता है, बल्कि संपादित परिणाम की सटीकता और सामान्यता को भी सुनिश्चित करता है।
इसके अलावा, ड्रीमो की ऑपन सोर्स प्रकृति इसके प्रभाव को और अधिक मजबूत बनाती है। फ्रेमवर्क हग्गिंग फेस (Hugging Face) और गिटहब (GitHub) पर पूर्ण कोड और दस्तावेज़ प्रदान करता है, जिससे डेवलपर्स को कास्टम फ़ंक्शनलिटीज़ का विकल्प करने और उसे विस्तार करने का मौका मिलता है। AIबेस (AIbase) संपादक दल का मानना है कि यह खुले सोर्स स्ट्रेटेजी ड्रीमो को वैश्विक डेवलपर्स कम्युनिटी में तेजी से प्रसारित करने में मदद करेगी, और इससे और अधिक नवाचारशील एप्लिकेशन्स का उद्भव होगा। < /p >
< p > < strong > अनुप्रयोग: क्रिएटिव डिज़ाइन से व्यावसायिक लैंडिंग तक
< p > ड्रीमो की विविध फ़ंक्शनलिटीज़ ने इसके कई स्केल में विशेष प्रभावशीलता प्रदान की है। क्रिएटिव डिज़ाइन क्षेत्र में, कलाकार शैली ट्रांसफर फ़ंक्शन का उपयोग करके तेजी से विभिन्न शैलियों के कार्यक्रम बना सकते हैं, या कपड़े बदलने की सुविधा का उपयोग करके वर्चुअल चरित्रों के लिए विविध ढंग के ढांचे डिज़ाइन कर सकते हैं। ई-कॉमर्स और विज्ञापन उद्योग में, कपड़ा बदलने और बहुत से प्रधानताओं का संयोजन का उपयोग वर्चुअल ट्राय इन, प्रोडक्ट डिस्प्ले या परसोनलाइज़ड मार्केटिंग कॉंटेंट के उत्पादन के लिए किया जा सकता है। इसके अलावा, सोशल मीडिया और वीडियो क्रिएटर्स भी चेहरा बदलने और ढांचे में बदलने की सुविधा का उपयोग करके आकर्षक विचित्र विषय कॉंटेंट बना सकते हैं।
AIबेस (AIbase) ने अवलोकन किया है कि ड्रीमो का प्रकाशन एक आवेग के समय हुआ है जब AI छवि संपादन की मांग में वृद्धि हो रही है। परंपरागत उपकरणों जैसे Adobe Photoshop की तुलना में, ड्रीमो AI द्वारा अपने ऑटोमेटेड प्रक्रिया के माध्यम से प्रस्तुत कार्यों की लागत और समय को बहुत अधिक कम करता है, इससे बड़े पैमाने पर छोटे और मध्यम आकार के व्यवसायों और व्यक्तिगत क्रिएटर्स की ध्यान आकर्षित होने की उम्मीद है। < /p >
< p > < strong > उद्योग प्रभाव: ऑपन सोर्स इकोसिस्टम का एक और महत्वपूर्ण कदम
< p >