【AI दैनिक】 विभाग में आपका स्वागत है! यहां आप हर दिन कृत्रिम बुद्धिमत्ता के दुनिया की खोज कर सकते हैं, हम प्रतिदिन आपके लिए आईएआई के क्षेत्र में अपडेट करते हैं, डेवलपर्स पर केंद्रित होकर आपको तकनीकी ट्रेंड के बारे में जागरूक करते हैं और नवीनतम आईएआई उत्पाद अनुप्रयोगों के बारे में जानकारी देते हैं।

ताजा आईएआई उत्पाद जांचें :https://top.aibase.com/

1. ओपन सोर्स एंड-टू-एंड ऑडियो बिग मॉडल Step-Audio-AQAA: ऑडियो सीधे प्राकृतिक बोले गए वाक्य में बदल देता है

Step-Audio-AQAA एक ओपन सोर्स एंड-टू-एंड ऑडियो बिग मॉडल है, जो सीधे मूल ऑडियो इनपुट से प्राकृतिक ध्वनि आउटपुट उत्पन्न कर सकता है, जो मानव-मशीन अंतःक्रिया के अनुभव को बहुत अधिक बढ़ाता है। इस मॉडल में दो कोडबुक ऑडियो मार्कर, हड्डी LLM और न्यूरो एक्सीलरेटर तीन भाग होते हैं, जो ध्वनि में जटिल जानकारी के प्रभावी निपटान के लिए अनुकूल होते हैं, और भविष्य के स्मार्ट ध्वनि अनुप्रयोगों के लिए एक मजबूत आधार तैयार करते हैं।

image.png

【AiBase सारांश:】

🔊 Step-Audio-AQAA ऑडियो इनपुट से सीधे प्राकृतिक बोले गए वाक्य उत्पन्न कर सकता है, मानव-मशीन अंतःक्रिया के अनुभव को बढ़ाता है।

📊 मॉडल संरचना दो कोडबुक ऑडियो मार्कर, हड्डी LLM और न्यूरो एक्सीलरेटर तीन मॉड्यूल से बनी हुई है, जो ध्वनि में जटिल जानकारी को प्रभावी ढंग से ग्रहण कर सकते हैं।

🎤 Step-Audio-AQAA के लॉन्च ने ध्वनि अंतःक्रिया तकनीक में महत्वपूर्ण प्रगति की है, भविष्य के स्मार्ट ध्वनि अनुप्रयोगों के लिए नई दिशा प्रदान करता है।

विवरण लिंक:https://huggingface.co/stepfun-ai/Step-Audio-AQAA

2. बाइडू ने "हुई एक्सप्लोर" प्लेटफॉर्म और MuseSteamer लॉन्च किया: AI द्वारा वीडियो बनाना, एक छवि के साथ विशेषज्ञ स्तर के फिल्म बनाएं!

बाइडू ने "हुई एक्सप्लोर" प्लेटफॉर्म और MuseSteamer लॉन्च किया, जो जनरेटिव आईएआई और मल्टीमीडिया तकनीक के माध्यम से वीडियो बनाने के लिए एक व्यापक समाधान प्रदान करता है, जो खोज, विज्ञापन आदि के अनुप्रयोगों की आवश्यकता को पूरा करता है। MuseSteamer के पास मजबूत नियंत्रण और उच्च लागत-प्रभावशीलता है, जिससे उपयोगकर्ता केवल छवि अपलोड करके विशेषज्ञ स्तर के वीडियो सामग्री बना सकते हैं, जो वीडियो बनाने की प्रक्रिया को बहुत सरल बना देता है।

image.png

【AiBase सारांश:】

🎥 MuseSteamer ध्वनि और वीडियो के एकीकृत उत्पादन का समर्थन करता है, फिल्म स्तर के उत्पादन प्रभाव प्रदान करता है।

🔄 10 सेकंड के लगातार गतिशील वीडियो उत्पादन का समर्थन करता है, रचनात्मकता की दक्षता बढ़ाता है।

🖼️ उपयोगकर्ता केवल एक छवि अपलोड करके विशेषज्ञ स्तर के वीडियो सामग्री बना सकते हैं।

विवरण लिंक:https://huixiang.baidu.com/

3. जियांग डा और अलीबाबा ने ओम्नीएवेटर के साथ घोषणा की: ध्वनि चलित पूर्ण डिजिटल मानव मॉडल धार्मिक रूप से दिखाई देता है

जियांग डा और अलीबाबा द्वारा संयुक्त रूप से जारी किए गए ओम्नीएवेटर मॉडल ने ध्वनि चलित डिजिटल मानव प्रौद्योगिकी में महत्वपूर्ण प्रगति की है, जो प्राकृतिक ध्वनि और धाराप्रवाह वाले पूर्ण डिजिटल मानव वीडियो उत्पन्न कर सकता है, विशेष रूप से गाने के मामले में अच्छा प्रदर्शन करता है। इस मॉडल में टेक्स्ट टिप्पणी के माध्यम से बनाई गई विवरण के सूक्ष्म नियंत्रण के समर्थन के साथ बहु-अनुप्रयोग संभावना है, जो बाजार, शिक्षा और मनोरंजन के क्षेत्रों में नवाचार की संभावना प्रदान करता है।

image.png

【AiBase सारांश:】

🎧 ध्वनि चलित प्रौद्योगिकी पूर्ण डिजिटल मानव वीडियो उत्पादन करती है

🎨 टेक्स्ट टिप्पणी के माध्यम से विवरण के सूक्ष्म नियंत्रण का समर्थन करता है, लचीलापन बढ़ाता है

🌐 ओपन सोर्स परियोजना व्यावसायिक अनुप्रयोगों के लिए व्यापक अनुप्रयोग स्थान प्रदान करता है

4. बाइडू खोज में दस वर्ष के सबसे बड़े अपडेट: AI बुद्धिमान बॉक्स, बेस और AI सहायक विकसित हो रहे हैं

बाइडू खोज में दस वर्षों के सबसे बड़े अपडेट किए गए हैं, जिसमें बुद्धिमान बॉक्स, बेस और AI सहायक जैसे नवाचार कार्यक्रम शामिल हैं, जो उपयोगकर्ताओं के खोज अनुभव और रचनात्मक क्षमता को महत्वपूर्ण रूप से बढ़ाते हैं।

image.png

【AiBase सारांश:】

🧠 बुद्धिमान बॉक्स 1000 शब्दों के इनपुट का समर्थन करता है, बहुमाध्यमिक अंतःक्रिया क्षमता में सुधार करता है।

🎥 बेस कार्यक्रम अपग्रेड किया गया है, मिश्रित सामग्री आउटपुट और बुद्धिमान एजेंट सेवा का समर्थन करता है।

📽️ AI सहायक में वीडियो कॉलिंग कार्यक्रम जोड़ा गया है, रचनात्मकता और खोज क्षमता में सुधार करता है।

5. xAI कंसोल में Grok4 और Grok4Code के उल्लेख जोड़े गए हैं, जो अगली पीढ़ी के AI मॉडल के आगमन के संकेत देते हैं