आपका स्वागत है 【AI Daily】 खंड में! यहाँ आप रोज़मर्रा के लिए एक गाइड है जो आपको एक समय पर कृपया अंग्रेजी में पढ़ने की अनुमति देता है। हम रोज़ आपको AI के क्षेत्र में जोड़ने वाली हालिया सामग्री पेश करते हैं, डेवलपर्स को ध्यान में रखते हुए, आपको तकनीकी ट्रेंडों को समझने और नवाचारी AI उत्पादों और अनुप्रयोगों को जानने की सहायता प्रदान करते हैं।
नवीन AI उत्पाद के बारे में जानें:https://top.aibase.com/
1. Alibaba Tongyi Wanxiang Wan2.1-VACE को ओपन सोर्स किया गया, वो पहला ओपन सोर्स वीडियो संपादन एकीकृत मॉडल कहा जाता है।
Tongyi Wanxiang ने VACE को ओपन सोर्स किया, जो विभिन्न प्रणालियों और कार्यों का समर्थन करता है, वीडियो निर्माण के एक-स्टॉप अनुभव प्रदान करता है, और बहुमोड़ इनपुट मैकेनिज्म के माध्यम से अधिक प्रभावी और लचीले वीडियो संपादन की सुविधा प्रदान करता है।
【AiBase नोट:】
✨ पाठ से वीडियो, छवि संदर्भ उत्पादन, वीडियो विस्तार आदि के कई कार्यों का समर्थन करता है, निर्माण दक्षता में सुधार करता है।
🌟 शासित पुनरेक्सप्रेशन की मजबूत क्षमता, व्यक्ति की स्थिति, गति फ़्लो आदि पर नियंत्रण करता है, विषय और पृष्ठभूमि संदर्भ का समर्थन करता है।
🔧 वीडियो संश्लेषण इकाई (VCU) प्रस्तावित की गई है, बहुमोड़ इनपुट का समर्थन करती है, और बहुकार्यों की मुक्त संयोजन की सुविधा प्रदान करती है।
अधिक जानकारी के लिए: https://github.com/Wan-Video/Wan2.1
2. OpenAI ने ChatGPT को अद्यतन किया: GPT-4.1 जारी किया गया, जिसमें कोडिंग क्षमता बहुत मजबूत है।
OpenAI ने GPT-4.1 और इसके हल्के संस्करण GPT-4.1mini को जारी किया है, जो कोडिंग क्षमता में महत्वपूर्ण सुधार करता है और इंस्ट्रक्शन अनुभव को भी बेहतर बनाता है, जबकि उपयोगकर्ता अनुभव को भी सुधारता है।
【AiBase नोट:】
🚀 GPT-4.1 की मजबूत कोडिंग क्षमता है, जो जटिल प्रोग्रामिंग जरूरतों को अधिक प्रभावी ढंग से पूरा करता है, और रनटाइम को तेज करता है, डेवलपर्स और इंस्ट्रक्शन प्रोसेसिंग स्केनारियों के लिए एक आदर्श विकल्प है।
🌐 GPT-4.1mini हल्का और कुशल है, और संसाधित डिवाइसों पर भी लगातार काम करता है, निःशुल्क और फ़िल्टर्ड उपयोगकर्ताओं के लिए व्यापक पहुँच प्रदान करता है।
🌟 ChatGPT में लंबे क्लिक करके प्रतिलिपि करने, तालिका प्रतिलिपि करने और स्ट्रीमिंग की जोड़ी है, जिससे उपयोगकर्ता अनुभव में महत्वपूर्ण सुधार हुआ है।
3. Stability AI ने 341M अत्यधिक हल्का पाठ से आवाज़ तक रूपांतरण मॉडल ओपन सोर्स किया, जो मोबाइल पर लोकल रन कर सकता है, आवाज़ उत्पादन में केवल 8 सेकंड का समय लेता है!
Stability AI ने 'ARC पीछे की प्रशिक्षण स्थापित करने वाली तेज आवाज़ उत्पादन' नाम के एक अत्यधिक हल्का पाठ से आवाज़ तक रूपांतरण मॉडल को जारी किया है, जिसका पैरामीटर केवल 341M है, लेकिन H100 GPU पर 75 मिलीसेकंड में 12 सेकंड की आवाज़ उत्पादन करता है, और मोबाइल CPU पर 7 सेकंड में वही कार्य पूरा करता है, जिससे इसका प्रदर्शन बहुत अधिक है।
【AiBase नोट:】
⚡️ ARC पीछे की प्रशिक्षण विधि डिस्टिलेशन पर नहीं है, जिससे मॉडल की उत्पादन गति और गुणवत्ता में सुधार हुआ है।
📱 मॉडल का हल्का डिज़ाइन मोबाइल पर लोकल रन करने का समर्थन करता है, जिससे मोबाइल क्रिएटिव अप्लिकेशन अनुभव में महत्वपूर्ण सुधार हुआ है।
💫 आवाज़ से आवाज़ फ़ंक्शन शैली स्थानांतरण करता है, जो कि अधिक रचनात्मक विचार प्रेरित करता है।
अधिक जानकारी के लिए: https://arxiv.org/pdf/2505.08175
4. Poe रिपोर्ट: Keling बड़े मॉडलों का 30% शेयर लेता है, Runway से आगे रहता है।
हाल ही में जारी किये गए 2025 वसंत ऋतु AI मॉडल उपयोग प्रवृत्ति रिपोर्ट के अनुसार, चीन के Kuaishou के कई Keling वीडियो उत्पादन मॉडल की वीडियो उत्पादन क्षमता में उल्लेखनीय प्रदर्शन है, शेयर 30% है, जहाँ Keling 2.0 मॉडल ने तीन सप्ताह में 21% उपयोग का शेयर हासिल किया। साल 2022 के जून में जारी किये जाने के बाद, वैश्विक उपयोगकर्ता 2200 लाख से अधिक हो गए हैं, मासिक सक्रिय उपयोगकर्ता 25 गुना बढ़ गए हैं, वीडियो और छवियों की संख्या में महत्वपूर्ण वृद्धि हुई है।
【AiBase नोट:】
🌟 Keling बड़े मॉडलों का वीडियो उत्पादन क्षमता में 30% शेयर है, Runway जैसे प्रतियोगियों से आगे रहता है।
📈 Keling 2.0 मॉडल के 4 महीने के बाद तीन सप्ताह में 21% वीडियो उत्पादन बाजार में शेयर हासिल करता है।
👥 Keling AI के वैश्विक उपयोगकर्ताओं की संख्या 2200 लाख से अधिक है, मासिक सक्रिय उपयोगकर्ता 25 गुना बढ़ गए हैं, वीडियो और छवियों की संख्या में महत्वपूर्ण वृद्धि हुई है।
5. Microsoft WizardLM टीम “टेंसेंट” की ओर समायोजित हो गई है, या अब हंयुआन मिश्रित मॉडल विकास प्रणाली में शामिल हो गई है।