【AI दैनिक】 विभाग में आपका स्वागत है! यहां आप हर दिन कृत्रिम बुद्धिमत्ता की दुनिया के खोज का एक निर्देशक है, हम हर दिन आपके लिए AI के क्षेत्र में गर्म विषय प्रस्तुत करते हैं, डेवलपर्स पर केंद्रित होते हुए, आपको तकनीकी प्रवृत्ति के बारे में जागरूक करते हैं और नवीनतम AI उत्पाद अनुप्रयोगों के बारे में जानकारी देते हैं।
ताजा AI उत्पाद जांचें :https://top.aibase.com/
1. बाइटडांस EX-4D अद्भुत ओपन सोर्स: एकल निर्देशक वीडियो एक स्वतंत्र दृष्टिकोण 4D फिल्म में बदल देता है
EX-4D बाइटडांस PICO-MR टीम द्वारा पेश किया गया 4D वीडियो जनरेशन फ्रेमवर्क है, जो एकल निर्देशक वीडियो से उच्च गुणवत्ता वाले, विभिन्न दृष्टिकोण वाले 4D वीडियो अनुक्रम बनाता है। इस तकनीक के माध्यम से गहरे बंद नेट (DW-Mesh) और हल्के आकार अनुकूलन ढांचे का उपयोग करके, विविध दृष्टिकोण जनरेशन में पारंपरिक वीडियो जनरेशन तकनीक के चुनौतियों को हल किया गया है, और एक व्यापक विकास में विशेषता प्रदर्शित करता है।
【AiBase सारांश:】
💡 EX-4D गहरे बंद नेट (DW-Mesh) के माध्यम से एकल निर्देशक वीडियो से बहु-दृष्टिकोण उच्च गुणवत्ता वाले उत्पादन करता है।
🔍 रेंडरिंग मास्क और ट्रैकिंग मास्क रणनीति के माध्यम से, बहु-दृष्टिकोण डेटा की कमी की समस्या हल करता है।
🚀 FID, FVD और VBench जैसे मापदंडों पर वर्तमान ओपन सोर्स विधियों के सभी पहलुओं में अधिकतम प्रदर्शन प्रदर्शित करता है, जो उत्कृष्ट प्रदर्शन विशेषता है।
विवरण लिंक: https://github.com/tau-yihouxiang/EX-4D
2. Bilibili ओपन सोर्स एनिमेशन वीडियो जनरेशन मॉडल AniSora V3 वर्जन, एक क्लिक पर विभिन्न शैली वाले एनिमेशन वीडियो लेंस बनाएं
Bilibili ने अपने ओपन सोर्स एनिमेशन वीडियो जनरेशन मॉडल AniSora V3 के महत्वपूर्ण अपडेट की घोषणा की, जो उत्पादन गुणवत्ता, गति और शैली विविधता में बहुत अधिक सुधार करता है। इस संस्करण का उपयोग CogVideoX-5B और Wan2.1-14B मॉडल पर किया गया है, जिसमें मानव प्रतिक्रिया और प्रबलन अधिकरण (RLHF) ढांचे के साथ विस्तारित किया गया है, जो विभिन्न एनिमेशन शैलियों के वीडियो जनरेशन का समर्थन करता है, जो रचनाकारों के लिए अधिक शक्तिशाली उपकरण प्रदान करता है।
【AiBase सारांश:】
✨ AniSora V3 एक अंतर-समय मास्क मॉड्यूल के माध्यम से अपग्रेड करके, एनिमेशन कार्य के नियंत्रण क्षमता में सुधार करता है।
🚀 बहु-कार्य संसाधन का समर्थन करता है, जिसमें एकल फ्रेम छवि से वीडियो जनरेशन, की-फ्रेम इंटरपोलेशन और मुख ताल मिलान जैसी विशेषताएं शामिल हैं।
📦 ओपन सोर्स इकोसिस्टम समुदाय सहयोग को बढ़ावा देता है, डेवलपर्स GitHub से कोड और डेटासेट प्राप्त कर सकते हैं।
विवरण लिंक: https://t.co/I3HPKPvsBV
3. DeepSWE ओपन सोर्स AI एजेंट प्रणाली शक्तिशाली रूप से ऊपर उठ गई, Qwen3-32B पर आधारित
DeepSWE एक Qwen3-32B मॉडल पर आधारित ओपन सोर्स AI एजेंट प्रणाली है, जो प्रबलन अधिकरण के साथ प्रशिक्षित हुआ है, और SWE-Bench-Verified परीक्षण में उत्कृष्ट प्रदर्शन प्रदर्शित किया है। इस प्रणाली में rLLM फ्रेमवर्क और सुधारित GRPO++ एल्गोरिथ्म का उपयोग किया गया है, जो सॉफ्टवेयर इंजीनियरिंग कार्य में उत्कृष्ट शिक्षण क्षमता और अनुप्रयोग संभावनाएं प्रदर्शित करता है।
【AiBase सारांश:】
🧠 DeepSWE Qwen3-32B मॉडल पर आधारित है, पूरी तरह से प्रबलन अधिकरण द्वारा प्रशिक्षित है, ओपन सोर्स जानकारी पूरी तरह से जारी कर दी गई है।
🏆 SWE-Bench-Verified परीक्षण में, DeepSWE उत्कृष्ट प्रदर्शन करता है, Pass@1 सटीकता 59% तक पहुंच गई है, जो सभी ओपन सोर्स एजेंटों में शीर्ष प्रदर्शन है।
💡 rLLM फ्रेमवर्क और सुधारित GRPO++ एल्गोरिथ्म के उपयोग के कारण, DeepSWE वास्तविक सॉफ्टवेयर इंजीनियरिंग कार्य में अपन उत्कृष्ट शिक्षण क्षमता और अनुप्रयोग संभावनाएं प्रदर्शित करता है।
विवरण लिंक: https://huggingface.co/agentica-org/DeepSWE-Preview
4. बाइटडांस नए मॉडल VINCIE-3B के साथ ओपन सोर्स लॉन्च करता है: 3 अरब अंक, संदर्भ लगातार छवि संपादन का समर्थन करता है
बाइटडांस ने संदर्भ लगातार छवि संपादन के समर्थन के साथ VINCIE-3B मॉडल ओपन सोर्स किया है, जो MM-DiT आर्किटेक्चर पर विकसित किया गया है, जो वीडियो से सीखकर और छवि संपादन के लिए उच्च दक्षता प्रदान करता है। इसकी तकनीकी विशेषताएं वीडियो ड्राइवन ट्रेनिंग, ब्लॉक कॉज़ल डिफ्यूज़न ट्रांसफॉर्मर और तीन एजेंट टास्क ट्रेनिंग के साथ बहुत अधिक छवि संपादन की गुणवत्ता और दक्षता में सुधार करता है।
【AiBase सारांश:】
🎥 वीडियो ड्राइवन ट्रेनिंग: VINCIE-3B वीडियो के लगातार फ्रेम का उपयोग करके, स्वचालित रूप से पाठ विवरण और छवि अनुक्रम निकालता है, बहु-माध्यम ट्रेनिंग डेटा बनाता है।