एआई डेली कॉलम में आपका स्वागत है! यह आपके दैनिक कृत्रिम बुद्धिमत्ता विश्व की खोज का मार्गदर्शक है, हम प्रतिदिन आपके लिए एआई क्षेत्र में गर्म विषय प्रस्तुत करते हैं, डेवलपर्स पर केंद्रित होते हुए आपको तकनीकी प्रवृत्ति और नवीनतम एआई उत्पाद अनुप्रयोग के बारे में जानकारी देते हैं।
ताजा एआई उत्पाद जांचें :https://app.aibase.com/zh
1. स्टेप द्वारा एंड-टू-एंड ऑडियो बड़ा मॉडल स्टेप-ऑडियो 2 मिनी जारी किया गया
स्टेप स्टार्स ने सबसे शक्तिशाली ओपन सोर्स एंड-टू-एंड ऑडियो बड़ा मॉडल स्टेप-ऑडियो 2 मिनी जारी किया, जो अंतरराष्ट्रीय बेंचमार्क टेस्ट में एसओटी बन गया है, जो ऑडियो समझ, बोली समझ, भाषा के बीच अनुवाद और बातचीत क्षमता में अद्भुत प्रदर्शन करता है। इस मॉडल के अविष्कार आर्किटेक्चर डिज़ाइन है, जो पारंपरिक एएसआर + एलएलएम + टीटीएस तीन स्तरों के संरचना को तोड़ता है, और बूढ़े ऑडियो इनपुट को बोली उत्तर आउटपुट के सीधे रूपांतरण में प्राप्त करता है, और चेन थिंकिंग रिज़र्च और सुधार शिक्षा के संयुक्त अनुकूलन के साथ शामिल होता है, जो अप्रत्यक्ष जानकारी के समझ और प्राकृतिक जवाब देने में सुधार करता है।
【AiBase सारांश:】
🔥 स्टेप-ऑडियो 2 मिनी अंतरराष्ट्रीय बेंचमार्क टेस्ट में एसओटी बन गया है, जो Qwen-Omni, Kimi-Audio आदि ओपन सोर्स मॉडल से अधिक क्षमता रखता है।
🧠 मॉडल वास्तविक एंड-टू-एंड मल्टीमीडिया आर्किटेक्चर का उपयोग करता है, जो पारंपरिक एएसआर + एलएलएम + टीटीएस तीन स्तरों के संरचना को तोड़ता है, जिससे ऑडियो प्रोसेसिंग अधिक सरल और कम देरी वाली होती है।
💡 चेन थिंकिंग रिज़र्च और सुधार शिक्षा के संयुक्त अनुकूलन के साथ शामिल होता है, जो भावना, टोन, संगीत आदि के अप्रत्यक्ष जानकारी के समझ और प्राकृतिक जवाब देने में सुधार करता है।
विवरण लिंक: https://github.com/stepfun-ai/Step-Audio2
2. 9 सितंबर को AI सामग्री नियम लागू हो गए! पहचान नहीं करना अवैध है, 34 लाख सामग्री रचनाकार तत्काल प्रतिक्रिया दे रहे हैं
9 सितंबर से लागू होने वाले "कृत्रिम बुद्धिमत्ता जनित संश्लेषित सामग्री पहचान विधि" चीन के AI सामग्री व्यवस्थापन के नियमित और सामान्य चरण में प्रवेश करने का एक चिह्न है। नए नियम निर्दिष्ट और अस्पष्ट पहचान के लिए आवश्यकता है, जो जानकारी की पारदर्शिता बढ़ाएगा और झूठी जानकारी के प्रसार को रोकेगा।
【AiBase सारांश:】
✅ आवश्यकता के अनुसार AI जनित सामग्री के लिए टेक्स्ट, छवि, वीडियो और ऑडियो में स्पष्ट चिह्न लगाया जाना चाहिए, AI सामग्री की छिपी हुई तकनीक को तोड़ता है।
🔍 अस्पष्ट पहचान डिजिटल फिंगरप्रिंट तकनीक के माध्यम से मेटाडेटा में एम्बेड करता है, जो सामग्री ट्रेसिंग और नियमन क्षमता में सुधार करता है।
⚖️ अवैध परिणाम गंभीर हैं, जैसे कि लिमिटिंग, सुधार, नीचे ले जाना और कानूनी जोखिम, AI उद्योग के विकास के लिए नियमित बनाता है।
3. मेयो ने ओपन सोर्स बड़ा मॉडल LongCat लॉन्च किया: डेवलपर्स को शक्ति प्रदान करने के लिए, AI एप्लिकेशन के वितरण को तेज करने के लिए
मेयो द्वारा लॉन्च किए गए ओपन सोर्स बड़ा मॉडल LongCat के प्रौद्योगिकी क्षमता शक्तिशाली है, जो नवीनतम मिश्रित एक्सपर्ट आर्किटेक्चर के माध्यम से दक्ष गणना प्रदर्शन प्राप्त करता है, और कई बेंचमार्क टेस्ट में अच्छा प्रदर्शन करता है, जो डेवलपर्स के लिए शक्तिशाली उपकरण प्रदान करता है।
【AiBase सारांश:】
🧠 LongCat-Flash में 56 बिलियन पैरामीटर हैं, मिश्रित एक्सपर्ट (MoE) आर्किटेक्चर का उपयोग करता है, जो गणना की दक्षता के लिए आंशिक पैरामीटर को डायनामिक रूप से सक्रिय करता है।
🚀 एक सेकंड में 100 से अधिक टोकन के लिए अनुमान क्षमता है, कम देरी और उच्च विस्तार क्षमता के साथ।
📊 MMLU, गणितीय तर्क आदि के कार्य में अच्छा प्रदर्शन करता है, जो वास्तविक अनुप्रयोग में इसकी क्षमता को दर्शाता है।
विवरण लिंक: https://longcat.chat/
4. शंघाई AI प्रयोगशाला ने बहुमाध्यमिक बड़ा मॉडल शू वैन वैन InternVL3.5 जारी किया
शंघाई AI प्रयोगशाला ने बहुमाध्यमिक बड़ा मॉडल InternVL3.5 जारी किया, जो अद्वितीय चेन-स्तरीय सुधार शिक्षा, डायनामिक दृश्य विश्व विभाजन राउटिंग और अलग-अलग वितरण आर्किटेक्चर के माध्यम से अनुमान क्षमता, वितरण दक्षता और सामान्य क्षमता के सभी विकास के साथ आया है। इस मॉडल के कई बेंचमार्क टेस्ट में अच्छा प्रदर्शन करता है, GPT-5 और Claude-3.7-Sonnet जैसे मुख्य मॉडल से अधिक है।
【AiBase सारांश:】
✨ InternVL3.5 चेन-स्तरीय सुधार शिक्षा ढांचा का उपयोग करता है, जो अनुमान प्रदर्शन में महत्वपूर्ण सुधार करता है।
🖼️ मॉडल विभिन्न दृश्य विश्व विभाजन के समर्थन करता है और उत्तर की गति को अनुकूलित करता है।