आपका स्वागत है 【AI दैनिक】 कॉलम में! यहाँ आपका हर दिन आर्टिफिशियल इंटेलिजेंस की दुनिया की खोज करने का गाइड है, हर दिन हम आपको AI क्षेत्र की हॉट कंटेंट प्रस्तुत करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, आपको तकनीकी प्रवृत्तियों को समझने में मदद करते हैं, और नवीन AI उत्पादों के अनुप्रयोगों के बारे में जानकारी देते हैं।
ताजा AI उत्पादजानने के लिए क्लिक करें:https://top.aibase.com/
1. कुन्लुन वानवे ने AI शॉर्ट ड्रामा निर्माण के लिए पहला ओपन-सोर्स वीडियो जनरेशन मॉडल SkyReels-V1 जारी किया
कुन्लुन वानवे ने AI शॉर्ट ड्रामा निर्माण के लिए पहले वीडियो जनरेशन मॉडल SkyReels-V1 और इसके एक्सप्रेशन और मूवमेंट कंट्रोल एल्गोरिदम SkyReels-A1 को ओपन-सोर्स करने की घोषणा की है, जिसका उद्देश्य मौजूदा मॉडलों की उच्च लागत और उपयोग में कठिनाई के मुद्दों को हल करना है। यह नवाचार AI शॉर्ट ड्रामा उद्योग के विकास को बढ़ावा देगा, उच्च गुणवत्ता वाले फिल्म और वीडियो कंटेंट निर्माण की क्षमता प्रदान करेगा। SkyReels-V1 ने उच्च गुणवत्ता वाले डेटा के प्रशिक्षण के माध्यम से पात्रों के प्रदर्शन पर विस्तृत नियंत्रण प्राप्त किया है, जो विभिन्न एक्सप्रेशन और मूवमेंट संयोजनों का समर्थन करता है, वीडियो की वास्तविकता और अभिव्यक्ति को बढ़ाता है।
【AiBase सारांश:】
🎥 SkyReels-V1 चीन का पहला ओपन-सोर्स AI शॉर्ट ड्रामा वीडियो जनरेशन मॉडल है, जो 33 एक्सप्रेशन्स और 400 से अधिक मूवमेंट संयोजनों का समर्थन करता है।
🤖 SkyReels-A1 पहला SOTA स्तर का एक्सप्रेशन मूवमेंट कंट्रोल एल्गोरिदम है, जो उच्च विश्वास के साथ माइक्रो एक्सप्रेशन्स को पुनः प्रस्तुत कर सकता है।
🌐 कुन्लुन वानवे ओपन-सोर्स तकनीक को बढ़ावा देने और AI शॉर्ट ड्रामा उद्योग में नवाचार और विकास को बढ़ाने के लिए प्रतिबद्ध है, जिससे निर्माण लागत को कम किया जा सके।
विस्तार से लिंक:https://github.com/SkyworkAI/SkyReels-V1
2. xAI का ग्रोक3 मॉडल जारी: GPT-4o से आगे, 10 गुना अधिक गणनात्मक क्षमता
xAI ने सोमवार को अपने नवीनतम फ्लैगशिप AI मॉडल ग्रोक3 को जारी किया, जो कंपनी की आर्टिफिशियल इंटेलिजेंस क्षेत्र में महत्वपूर्ण प्रगति को दर्शाता है। ग्रोक3 की गणनात्मक क्षमता पिछले संस्करण ग्रोक2 की तुलना में 10 गुना बढ़ गई है, यह छवियों का विश्लेषण कर सकता है और सवालों के जवाब दे सकता है, और कई बेंचमार्क परीक्षणों में OpenAI के GPT-4o को पीछे छोड़ दिया है। नया फीचर DeepSearch उपयोगकर्ताओं को तेजी से गहरे जानकारी विश्लेषण प्राप्त करने की अनुमति देता है, जो ग्रोक एप्लिकेशन की उपयोगिता को और बढ़ाता है। भविष्य में वॉइस मोड भी जारी किया जाएगा, जो उपयोगकर्ताओं को एक समृद्ध अनुभव प्रदान करेगा।
【AiBase सारांश:】
🧠 ग्रोक3 xAI का नवीनतम AI मॉडल है, जिसकी गणनात्मक क्षमता पिछले संस्करण से 10 गुना बढ़ी है।
📈 ग्रोक3 छवियों का विश्लेषण कर सकता है और सवालों के जवाब दे सकता है, और कई बेंचमार्क परीक्षणों में GPT-4o को पीछे छोड़ दिया है।
🔍 नए लॉन्च किए गए DeepSearch फीचर से गहरे जानकारी विश्लेषण की सुविधा मिलती है, जिससे उपयोगकर्ताओं को तेजी से जानकारी प्राप्त करने में मदद मिलती है।
3. स्टेप ने 130B डोमिनेटिंग वॉयस मॉडल को ओपन-सोर्स किया, रीयल-टाइम बातचीत + इमोशन क्लोनिंग, धमाकेदार आ रहा है
स्टेप ऑडियो ने हाल ही में 1300 अरब पैरामीटर वाला एक वॉयस मॉडल ओपन-सोर्स किया है, जो वॉयस इंटरएक्शन क्षेत्र में एक महत्वपूर्ण突破 का प्रतीक है। यह मॉडल वॉयस समझ और जनरेशन कंट्रोल की क्षमताओं को मिलाता है, जिसमें बहुभाषी समर्थन और बोलियों की पहचान की शक्तिशाली क्षमता है, जो व्यक्तिगत वॉयस इंटरएक्शन अनुभव को सक्षम बनाता है। इसके अलावा, इसकी इमोशन कंट्रोल और वॉयस क्लोनिंग सुविधाएं उपयोगकर्ताओं को और भी समृद्ध इंटरैक्शन की संभावनाएं प्रदान करती हैं, जो दर्शाती हैं कि भविष्य का वॉयस AI और अधिक बुद्धिमान और स्वाभाविक होगा।
【AiBase सारांश:】
🚀 यह मॉडल उद्योग का पहला रीयल-टाइम वॉयस बातचीत प्रणाली है जो वॉयस समझ और जनरेशन कंट्रोल को एकीकृत करता है, जिसमें शक्तिशाली नियंत्रण क्षमताएं हैं।
🌍 यह कई भाषाओं और बोलियों का समर्थन करता है, जिसमें चीनी, अंग्रेजी, जापानी, और कांतोनिज़, सिचुआन बोलियां शामिल हैं, जो क्रॉस-लैंग्वेज कम्युनिकेशन में सुविधा प्रदान करती हैं।
🎶 इसमें वॉयस क्लोनिंग और इमोशन कंट्रोल की क्षमताएं हैं, जिससे उपयोगकर्ता अपनी आवाज के इमोशन टोन को सेट कर सकते हैं और व्यक्तिगत वॉयस असिस्टेंट बना सकते हैं।
विस्तार से लिंक:https://github.com/stepfun-ai/Step-Audio/tree/main
4. बेहतरीन परिणाम! स्टेप-स्टार ने Step-Video-T2V वीडियो जनरेशन मॉडल को ओपन-सोर्स किया
आज, स्टेप-स्टार ने 吉利 ऑटोमोबाइल ग्रुप के साथ मिलकर दो ओपन-सोर्स मल्टी-मॉडल बड़े मॉडल लॉन्च किए, विशेष रूप से Step-Video-T2V वीडियो जनरेशन मॉडल, जो 30 अरब पैरामीटर के साथ वीडियो जनरेशन क्षेत्र में उत्कृष्ट क्षमता प्रदर्शित करता है। यह मॉडल न केवल उच्च गुणवत्ता वाले वीडियो बनाने में उत्कृष्टता दिखाता है, बल्कि आदेशों को सटीक रूप से समझता है, विभिन्न शॉट मूवमेंट का समर्थन करता है, और बनाई गई छवियाँ वास्तविक और भौतिक नियमों के अनुरूप होती हैं। डेवलपर्स इस मॉडल का अनुभव करने के लिए युआनवेन ऐप में जा सकते हैं और इसके लिए फीडबैक प्रदान कर सकते हैं, जिससे तकनीकी प्रगति को बढ़ावा मिलता है।
【AiBase सारांश:】
🌟 Step-Video-T2V मॉडल में 30 अरब पैरामीटर हैं, जो 204 फ्रेम 540P रिज़ॉल्यूशन का वीडियो उत्पन्न करता है, इसकी प्रदर्शन वैश्विक स्तर पर सबसे अच्छा है।
🎨 यह मॉडल मूवमेंट स्मूथनेस और एस्थेटिक्स जैसे पहलुओं में उत्कृष्टता दिखाता है, जो मौजूदा ओपन-सोर्स वीडियो मॉडलों को पीछे छोड़ देता है।
📱 दोनों मॉडल युआनवेन ऐप में उपलब्ध हैं, डेवलपर्स इसका अनुभव कर सकते हैं और सुझाव दे सकते हैं, तकनीकी विकास को बढ़ावा देने के लिए।
विस्तार से लिंक:https://github.com/stepfun-ai/Step-Audio
5. AI प्रतिभा लुओ फुली नई नौकरी पर पहुंच गई हैं
लुओ फुली, यह 95 की AI प्रतिभा लड़की, हाल ही में एक नए पेशेवर यात्रा की शुरुआत की है, हालाँकि कंपनी की जानकारी अभी तक प्रकट नहीं हुई है। उन्हें श्याओमी के संस्थापक लेई जून द्वारा 10 मिलियन सालाना वेतन के निमंत्रण के लिए व्यापक ध्यान मिला था। लुओ फुली ने पीकिंग यूनिवर्सिटी से कंप्यूटेशनल लिंग्विस्टिक्स में मास्टर डिग्री प्राप्त की, और बाद में अलीबाबा के दमो एकेडमी और DeepSeek जैसी कंपनियों में समृद्ध शोध अनुभव प्राप्त किया।
【AiBase सारांश:】
✨ लुओ फुली ने नई नौकरी शुरू की है, कंपनी की जानकारी अभी तक प्रकट नहीं हुई है।
💰 लेई जून ने लुओ फुली को श्याओमी टीम में शामिल होने के लिए 10 मिलियन सालाना वेतन का निमंत्रण दिया।
📈 DeepSeek-V2 मॉडल की लागत-प्रदर्शन अनुपात को लुओ फुली ने "किंग ऑफ कॉस्ट-परफॉरमेंस" कहा।
6. छोटे मॉडल + बड़े मॉडल का सहयोग! मीता AI सर्च ने "शैलो रिसर्च" फीचर लॉन्च किया
मीता नेटवर्क टेक्नोलॉजी कं, लिमिटेड ने 18 फरवरी 2025 को अपने नए फीचर "शैलो रिसर्च" को लॉन्च किया, जिसका उद्देश्य AI तकनीक का उपयोग करके तेजी से जानकारी इकट्ठा और विश्लेषण करना है, ताकि शोध दक्षता में सुधार हो सके। यह फीचर छोटे मॉडल और बड़े मॉडल के सहयोगात्मक आर्किटेक्चर का उपयोग करता है, जो कम समय में सैकड़ों वेबपृष्ठों की खोज और विश्लेषण करने में सक्षम है, जिससे शोध समय में काफी कमी आती है। हालाँकि यह अभी भी शैलो रिसर्च चरण में है, यह पहले से ही उपयोगकर्ताओं को प्रारंभिक विश्लेषण परिणाम प्रदान कर सकता है, जो जानकारी संसाधन में AI की विशाल क्षमता को प्रदर्शित करता है।
【AiBase सारांश:】
🧠 छोटे मॉडल और बड़े मॉडल के सहयोगात्मक आर्किटेक्चर का उपयोग कर शोध दक्षता में सुधार किया गया है।
⏱️ यह 2 से 3 मिनट में सैकड़ों वेबपृष्ठों की खोज और विश्लेषण कर सकता है।
📈 भविष्य में कोड निष्पादन और संख्यात्मक विश्लेषण जैसी क्षमताओं को जोड़ने की योजना है, जिससे शोध को और गहरा किया जा सके।
7. HYBE के तहत AI वॉयस टूल Supertone Play लॉन्च: 10 सेकंड में वॉयस क्लोनिंग
HYBE के तहत Supertone ने "Supertone Play" नामक टेक्स्ट-टू-स्पीच टूल लॉन्च किया है, जिसका उद्देश्य रचनाकारों को उच्च गुणवत्ता और अभिव्यक्तिपूर्ण ऑडियो कंटेंट प्रदान करना है। यह टूल अंग्रेजी, कोरियाई और जापानी का समर्थन करता है, और भविष्य में स्पेनिश और चीनी तक विस्तार करेगा। Supertone Play में 150 आवाज पात्र हैं, जो विभिन्न रचनात्मक आवश्यकताओं के लिए उपयुक्त हैं, और इसमें वॉयस क्लोनिंग की क्षमता है, जिससे उपयोगकर्ता अपनी आवाज के अनुसार व्यक्तिगत पात्र बना सकते हैं, और इमोशनल टोन को समायोजित कर सकते हैं।
【AiBase सारांश:】
🎙️ Supertone Play कई भाषाओं का समर्थन करता है, रचनाकारों के लिए 150 आवाज पात्र प्रदान करता है।
🔒 इस टूल में आवाज़ वेरिफिकेशन और अनसुने वॉटरमार्क जैसे सुरक्षा उपाय हैं, ताकि तकनीक का दुरुपयोग न हो।
🌍 परीक्षण चरण में, इस टूल का 80 से अधिक देशों में व्यापक उपयोग किया गया है, उपयोगकर्ता सक्रिय रूप से उत्पन्न सामग्री डाउनलोड कर रहे हैं।
विस्तार से लिंक:https://play.supertone.ai/
8. टेंसेंट इलेक्ट्रॉनिक साइन AI कॉन्ट्रैक्ट ड्राफ्टिंग फीचर लॉन्च करने जा रहा है
टेंसेंट इलेक्ट्रॉनिक साइन ने हाल ही में घोषणा की है कि वह AI कॉन्ट्रैक्ट ड्राफ्टिंग फीचर लॉन्च करने जा रहा है, जो हाइब्रिड और DeepSeek बड़े मॉडल तकनीक का उपयोग करेगा, जिसका उद्देश्य उपयोगकर्ताओं को सुविधाजनक कॉन्ट्रैक्ट निर्माण और प्रबंधन सेवाएं प्रदान करना है। AI के माध्यम से, छोटा वांग आसानी से एक सह-भाड़े का अनुबंध उत्पन्न कर सकता है और आवश्यक शर्तें जोड़ सकता है, जबकि छोटा ली तेजी से आपूर्तिकर्ता अनुबंध के संभावित जोखिमों की समीक्षा कर सकता है। कानूनी कर्मचारी लाओ झांग भी अनुबंधों का कुशलता से प्रबंधन कर सकते हैं, जिससे जानकारी की हानि से बचा जा सके। यह फीचर अनुबंध प्रसंस्करण की दक्षता और सटीकता को बहुत बढ़ा देगा।
【AiBase सारांश:】
🤖 AI एक क्लिक में अनुबंध उत्पन्न कर सकता है, ड्राफ्टिंग प्रक्रिया को सरल बनाता है, उपयोगकर्ता की कार्यवाही को कम करता है।
🔍 AI जोखिम स्कैनिंग सहायक के रूप में कार्य करता है, अनुबंध में संभावित नकारात्मक शर्तों को तेजी से पहचान सकता है।
📂 AI स्मार्ट अनुबंध प्रबंधन को सक्षम बनाता है, जिससे उपयोगकर्ताओं को महत्वपूर्ण जानकारी जल्दी से खोजने में मदद मिलती है, अनुबंध "खोने" से बचता है।
9. शेनझेन फुचेन और गुआंगज़ौ ने "AI सिविल सेवक" लॉन्च किया: DeepSeek बड़े मॉडल की तैनाती
शेनझेन के फुचेन जिले और गुआंगज़ौ ने क्रमशः DeepSeek बड़े मॉडल पर आधारित "AI सिविल सेवक" लॉन्च किया है, जो स्मार्ट गवर्नेंस के निर्माण में एक महत्वपूर्ण प्रगति का प्रतीक है। फुचेन जिले द्वारा लॉन्च किए गए AI स्मार्ट कर्मचारी ने 240 व्यावसायिक परिदृश्यों को कवर किया है, जो सरकारी सेवा की दक्षता को महत्वपूर्ण रूप से बढ़ाता है, व्यक्तिगत अनुकूलन जनरेशन समय में काफी कमी आई है, और समीक्षा समय 90% तक घट गया है। गुआंगज़ौ भी DeepSeek के आधार पर स्मार्ट गवर्नेंस प्रणाली के निर्माण को आगे बढ़ा रहा है, जो सरकारी सेवा को अनुकूलित करने में AI तकनीक की क्षमता को दर्शाता है।
【AiBase सारांश:】
🚀 फुचेन जिले ने AI स्मार्ट कर्मचारी लॉन्च किया है, जो 240 व्यावसायिक परिदृश्यों को कवर करता है, सरकारी सेवा की दक्षता बढ़ाता है।
⏱️ व्यक्तिगत अनुकूलन जनरेशन समय 5 दिन से मिनटों में घट गया है, समीक्षा समय 90% कम हुआ है।
🌐 गुआंगज़ौ ने DeepSeek के आधार पर स्मार्ट गवर्नेंस प्रणाली का निर्माण किया है, डिजिटल नए इंजन के निर्माण को बढ़ावा दिया है।
10. नेटEase यूडाओ ने देश का पहला AI मूलभूत अध्ययन हार्डवेयर SpaceOne पेश किया है, जो DeepSeek-R1 को एकीकृत करता है