- 6 जून को, दत्तात्रेय सिड़्डी टीम ने SeedEdit3.0 का आधिकारिक रिलीज़ किया। इस नई संस्करण का प्रतिमा संपादन मॉडल किसी भी प्रकार के बदलावों को संभालने और निर्देशों का पालन करने में अग्रणी प्रगति की। इससे प्रतिमा संपादन की उपयोगिता और कुशलता में महत्वपूर्ण सुधार हुआ है।
- SeedEdit3.0, Seedream3.0 प्रतिमा उत्पादन मॉडल पर आधारित है। इसमें विविध प्रकार के डेटा समावेशन तकनीकों और विशेष रिवार्ड मॉडल का प्रयोग किया गया है, जिससे पिछली प्रतिमा संपादन मॉडलों में पाए गए असफलताओं को हटाया गया है। इस मॉडल के पास 4K रिझोल्यूशन के प्रतिमाओं को संचालित करने और उत्पन्न करने की क्षमता है। इसमें विशेषज्ञता इंजिनियरिंग के क्षेत्र में विशेष अंतर है, जो प्रतिमा के विशिष्ट क्षेत्रों की ध्यानपूर्वक प्रक्रिया करता है और निर्मित क्षेत्र को उच्च अंतर्निहित तरीके से संरक्षित करता है। इसमें विशेष रूप से मानव चेहरे संपादन, पृष्ठभूमि बदलने, दृश्य और प्रकाश बदलाव जैसे जटिल स्थितियों में अत्यंत उत्कृष्ट क्षमता है।
- उदाहरण के रूप में, जब किसी प्रतिमा में अप्रयोजित व्यक्तियों को हटाने की भाँटी की जाती है, तो SeedEdit3.0 न केवल अप्रयोजित व्यक्तियों को सही ढंग से पहचान और हटा पाता है, बल्कि उनकी छायाओं को भी हटा देता है, जो इसकी अत्यधिक विशेषज्ञता को साबित करता है। जब 2D कला को एक वास्तविक मॉडल में बदलने की कार्यवाही की जाती है, तो यह मॉडल व्यक्ति के वस्त्रों, कपड़ों और हाथों के बैग जैसी विशेषताओं को बनाए रखता है और बनाया गया प्रतिमा सड़क फॉटोग्राफी के जैसा दिखता है। इसके अलावा, SeedEdit3.0 जटिल प्रकाश और छाया परिवर्तनों का प्रबंधन कर सकता है, जहाँ से पास के घरों से दूर के समुद्र की लहरों तक, सभी विशेषताओं को विचार प्रकाश के बदलाव के साथ "पिक्सल दर पिक्सल" स्तर पर ठीक ढंग से व्यवस्थित किया जाता है।
- इन क्षमताओं को प्राप्त करने के लिए, Seed टीम ने विकास के प्रक्रिया में एक कुशल डेटा समावेशन रणनीति तैयार की और कई विशेष रिवार्ड मॉडल बनाए हैं। इन रिवार्ड मॉडलों को डिफ्यूज़न मॉडल के साथ जुड़कर प्रशिक्षण दिया गया है, जिससे मुख्य कार्यों की संपादन गुणवत्ता में सुधार किया गया है, जैसे चेहरे की संगति और टेक्स्ट रेंडरिंग। इसके साथ ही, SeedEdit3.0 के प्रेरणा गति का भी सुधार किया गया है, जिससे यह 10 सेकंड के अंदर प्रेरित हो सकता है।
- SeedEdit3.0 की एफिक्सिया की मूल्यांकन करते समय, टीम ने सैकड़ों वास्तविक और संश्लेषित परीक्षण प्रतिमाओं को संग्रहीत किया और 23 प्रकार की संपादन ऑपरेशन सबटास्क्स का निर्माण किया, जो स्टाइलिंग, जोड़ना, प्रतिस्थापन, हटाना आदि आम ऑपरेशनों को शामिल करते हैं, और कैमरा गति, वस्तुओं की स्थिति परिवर्तन, परिदृश्य बदलाव आदि निर्देशात्मक आंदोलनों को भी शामिल करते हैं। मशीन की मूल्यांकन दिखाई दी कि SeedEdit3.0 संपादन निर्धारण के प्रभाव और निर्देशों के प्रतिक्रिया क्षमता में पिछली संस्करणों और अन्य वर्ग के मॉडलों की तुलना में अग्रणी है। रियलमैन मूल्यांकन भी साबित करता है कि SeedEdit3.0 की प्रतिमा निर्धारण क्षमता सर्वश्रेष्ठ है, उपयोगिता का अनुपात 56.1% था, जो पिछली संस्करणों की तुलना में महत्वपूर्ण सुधार है।
- SeedEdit3.0 के रिलीज़ से, प्रतिमा संपादन प्रौद्योगिकी AI क्षेत्र में एक बहुत ही महत्वपूर्ण प्रगति का चिन्ह है। यह मॉडल न केवल तकनीकी रूप से अनेक नवाचार करता है, बल्कि वास्तविक अनुप्रयोगों में भी अत्यधिक उपयोगिता और कुशलता प्रदर्शित करता है। वर्तमान में, SeedEdit3.0 का तकनीकी रिपोर्ट जनसमूह के लिए सार्वजनिक हो चुकी है, और मॉडल अब इत्मीनान पेज अंतर्गत टेस्ट कर रही है, और बीन पॉप ऐप भी जल्द ही लॉन्च हो जाएगी। उपयोगकर्ता अपलोड किए गए रीफरेंस फोटो और बदलाव प्रॉम्प्ट देकर इस मजबूत प्रतिमा संपादन टूल का अनुभव कर सकते हैं।
- परियोजना होमपेज:
- https://seed.bytedance.com/seededit
- तकनीकी रिपोर्ट:
- https://arxiv.org/pdf/2506.05083
- अनुभव प्रवेश:
- इत्मीनान पेज - प्रतिमा उत्पादन - रीफरेंस फोटो अपलोड - प्रतिमा 3.0 मॉडल चुनें - बदलाव प्रॉम्प्ट दें (ग्रे स्केल में टेस्टिंग में);
- बीन पॉप ऐप - AI प्रतिमा उत्पादन - रीफरेंस फोटो जोड़ें - बदलाव प्रॉम्प्ट दें (जल्द ही लॉन्च होने वाला)।
बाइटडान के द्वारा सीधीडिट 3.0 छवि संपादन मॉडल का जारी कराव, विशेषज्ञता और विस्तार की क्षमता में उत्तरोत्तर वृद्धि

AIbase基地
यह लेख AIbase दैनिक से है
【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।