एआई दैनिक: केलिंग एआई एपीआई के लिप-सिंकिंग क्षमता पूरी तरह से खुली; डौबाओ बड़े मॉडल ने GPT-4 को समकक्ष बताया; बाईडू 2024 के लिए एआई संकेत शब्द 'उत्तर'; टोंग यी कियान प्रश्न दृश्य मॉडल 80% कीमत में कटौती

【AI日报】栏目 में आपका स्वागत है! यह आपके लिए हर दिन कृत्रिम बुद्धिमत्ता की दुनिया की खोज करने का मार्गदर्शक है, हम हर दिन आपको AI क्षेत्र की गर्मागर्म सामग्री प्रस्तुत करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, और आपको तकनीकी प्रवृत्तियों को समझने में मदद करते हैं, साथ ही नवीन AI उत्पादों के अनुप्रयोगों को जानने में सहायता करते हैं।

ताज़ा AI उत्पादजानने के लिए क्लिक करें:https://top.aibase.com/

1. क्लींग AI API के लिप-सिंकिंग क्षमताएँ पूरी तरह से खुली, वर्चुअल ट्राई-ऑन V1.5 मॉडल में अपग्रेड हुआ

बीजिंग के快手 टेक्नोलॉजी कंपनी ने हाल ही में घोषणा की कि क्लींग AI (Kling) API ने एक नई अपग्रेड पूरी की है, जो मुख्य रूप से वर्चुअल ट्राई-ऑन और लिप-सिंकिंग क्षमताओं में महत्वपूर्ण प्रगति की है। अपग्रेड किए गए V1.5 मॉडल में "ऊपरी वस्त्र + निचले वस्त्र" संयोजन कपड़े का समर्थन किया गया है, जिससे ट्राई-ऑन अनुभव की वास्तविकता में वृद्धि हुई है। साथ ही, लिप-सिंकिंग क्षमताओं की पूरी खुलावट ने उत्पन्न वीडियो सामग्री को और अधिक जीवंत बना दिया है, जिससे नई रचनात्मक संभावनाएँ उत्पन्न हुई हैं। ये तकनीकी प्रगति ई-कॉमर्स, विज्ञापन विपणन जैसे क्षेत्रों के ग्राहकों को मजबूत समर्थन प्रदान करेगी, और दृश्य सामग्री के नवाचार और विकास को बढ़ावा देगी।

【AiBase सारांश:】

👗 क्लींग AI का V1.5 मॉडल संयोजन कपड़ों का समर्थन करता है, वर्चुअल ट्राई-ऑन की वास्तविकता और उपयोगिता को बढ़ाता है।

🎤 लिप-सिंकिंग क्षमताएँ पूरी तरह से खुली, वीडियो पात्रों के लिप-सिंक और वॉयसओवर के बीच सही समन्वय स्थापित करती हैं।

🚀 अपग्रेड से व्यावसायिक उपयोगकर्ताओं को नए कदम उठाने में मदद मिलेगी, दृश्य सामग्री नवाचार को बढ़ावा देगा।

2. डौबाओ बड़े मॉडल ने GPT-4 के साथ समानता का दावा किया, पहली बार 3000000 लंबे पाठ की क्षमता का खुलासा किया

बाइटडांस के तहत डौबाओ बड़े मॉडल ने 2024 तकनीकी प्रगति रिपोर्ट में घोषणा की कि इसका नवीनतम संस्करण Doubao-pro-1215 ने समग्र प्रदर्शन में GPT-4 के साथ पूर्ण समानता प्राप्त की है, और कुछ विशेष क्षेत्रों में और भी बेहतर प्रदर्शन किया है। यह प्रगति चीन के बड़े मॉडल तकनीक के उदय को दर्शाती है, जो उसकी समझने की सटीकता और उत्पन्न गुणवत्ता में उल्लेखनीय सुधार को दिखाती है, विशेष रूप से जटिल परिदृश्यों में GPT-4 को पार करते हुए, साथ ही अधिक प्रतिस्पर्धी सेवा मूल्य प्रदान करती है।

【AiBase सारांश:】

🚀 डौबाओ बड़े मॉडल ने समग्र प्रदर्शन में GPT-4 के साथ पूर्ण समानता प्राप्त की है, और कुछ विशेष क्षेत्रों में और अधिक मजबूत प्रदर्शन किया है।

💡 डेटा प्रोसेसिंग और नवाचार मॉडल आर्किटेक्चर को अनुकूलित करके, डौबाओ ने समझने की सटीकता और उत्पन्न गुणवत्ता में महत्वपूर्ण प्रगति की है।

📚 पहली बार 3000000 शब्दों की सुपर लंबे पाठ की प्रक्रिया क्षमता का खुलासा किया, जिसमें प्रसंस्करण देरी 15 सेकंड के भीतर नियंत्रित की गई है।

3. ज़ीपु डीप इनफेरेंस मॉडल GLM-Zero प्रीव्यू संस्करण लॉन्च हुआ

ज़ीपु हुवाज़ांग टेक्नोलॉजी कंपनी ने अपने पहले विस्तारित रिवॉर्ड लर्निंग तकनीक पर आधारित इनफेरेंस मॉडल GLM-Zero के प्रारंभिक संस्करण GLM-Zero-Preview को वार्षिक समापन पर जारी किया। यह मॉडल AI की गणितीय तर्क, कोड लेखन आदि क्षेत्रों में इनफेरेंस क्षमताओं को बढ़ाने पर केंद्रित है, और उत्कृष्ट प्रदर्शन दिखाता है। हालाँकि OpenAI के मॉडल के साथ अभी भी कुछ अंतर है, लेकिन कंपनी निरंतर अनुकूलन की योजना बना रही है, और अपने अनुप्रयोग क्षेत्रों का विस्तार कर रही है। उपयोगकर्ता ज़ीपु क्यूंगयान प्लेटफ़ॉर्म पर इस मॉडल का अनुभव कर सकते हैं, और डेवलपर्स API कॉल के माध्यम से इसका उपयोग कर सकते हैं।

微信截图_20241231095302.png

【AiBase सारांश:】

🚀 GLM-Zero-Preview AI की इनफेरेंस क्षमताओं को बढ़ाने पर केंद्रित है, विशेष रूप से गणितीय तर्क और कोड लेखन में उत्कृष्ट प्रदर्शन दिखाता है।

🛠️ उपयोगकर्ता ज़ीपु क्यूंगयान प्लेटफ़ॉर्म पर GLM-Zero-Preview का मुफ्त अनुभव कर सकते हैं, जिसमें टेक्स्ट और इमेज अपलोड का समर्थन किया गया है, और पूरा इनफेरेंस प्रक्रिया प्रदान की जाती है।

📈 प्रशिक्षण मात्रा बढ़ने के साथ, GLM-Zero-Preview की गहन इनफेरेंस में प्रभावशीलता धीरे-धीरे बढ़ रही है, जो रिवॉर्ड लर्निंग के महत्व को दर्शाती है।

विवरण लिंक:https://chatglm.cn/main/gdetail/676411c38945bbc58a905d31?lang=zh

4. बायडू ने 2024 का वार्षिक AI संकेत शब्द - "उत्तर" जारी किया

2024 के अंत में, बायडू ने वार्षिक AI संकेत शब्द "उत्तर" जारी किया, जो लोगों की AI पर निर्भरता और उम्मीदों को दर्शाता है। जैसे-जैसे लोग अक्सर AI से उत्तर मांगते हैं, "उत्तर", "क्यों" जैसे शब्द सामाजिक भावनाओं और व्यक्तिगत उलझनों को उजागर करते हैं। बायडू ने उच्च आवृत्ति वाले संकेत शब्दों का विश्लेषण करके दिखाया है कि AI कैसे लोगों के दैनिक जीवन में समाहित होता है, और सोच और भावनाओं का एक आश्रय बन जाता है।

【AiBase सारांश:】

🤖 AI लोगों के जीवन में उत्तर खोजने के लिए एक महत्वपूर्ण उपकरण बन गया है, जो सामाजिक भावनाओं और भ्रम को दर्शाता है।

🔍 उच्च आवृत्ति वाले संकेत शब्दों ने जीवन, काम और भावनाओं के संदर्भ में लोगों की सामान्य समस्याओं और इच्छाओं को उजागर किया है।

🌟 बायडू ने यह जोर दिया कि AI मानवता का साथी बनेगा, और भविष्य की संभावनाओं और अज्ञात क्षेत्रों की खोज में सहयोग करेगा।

5. टोंगयी ने 2024 युवा AI उपयोग प्रवृत्तियों की रिपोर्ट जारी की: 85 और 90 के बाद के युवा AI पर अधिक ध्यान दे रहे हैं

《2024 युवा AI उपयोग प्रवृत्ति रिपोर्ट》 के अनुसार, AI का उपयोग जीवन के विभिन्न क्षेत्रों में व्यापक रूप से फैला है, विशेष रूप से काम, अध्ययन और रचनात्मक अभिव्यक्ति में। 95 के बाद के, महिलाएँ और कॉर्पोरेट प्रबंधक AI पर सबसे अधिक ध्यान केंद्रित करते हैं। 80% से अधिक उत्तरदाताओं ने AI उपकरणों पर उच्च ध्यान बनाए रखा, और लगभग आधे उत्तरदाता प्रतिदिन AI का उपयोग करते हैं, जो यह दर्शाता है कि AI अब जीवन का एक अनिवार्य हिस्सा बन गया है।

【AiBase सारांश:】

🧑‍🎓 95 के बाद के, महिलाएँ और कॉर्पोरेट प्रबंधक AI पर ध्यान केंद्रित करने में वृद्धि कर रहे हैं, 80% से अधिक उत्तरदाता AI उपकरणों पर उच्च ध्यान दे रहे हैं।

🎨 AI को रचनात्मक अभिव्यक्ति और मनोरंजन गतिविधियों में व्यापक रूप से लागू किया गया है, युवा लोग AI द्वारा उत्पन्न सामग्री का प्रयास करने में खुश हैं।

🔍 हालाँकि AI की अपेक्षाएँ बढ़ रही हैं, लेकिन लोगों की डेटा गोपनीयता के प्रति चिंता भी बढ़ रही है, इस पर सतर्क रहना आवश्यक है।

6. OpenAI के CEO ने 2025 में नए तकनीकी उत्पादों की घोषणा की, AGI और वयस्क मोड ने चर्चा को जन्म दिया

OpenAI के CEO सैम ऑल्टमैन ने घोषणा की कि 2025 में कई नए तकनीकी उत्पाद लॉन्च किए जाएंगे, विशेष रूप से सामान्य कृत्रिम बुद्धिमत्ता (AGI) और बुद्धिमान कार्यों की कार्यक्षमता, जिसने व्यापक ध्यान आकर्षित किया है। नए उत्पादों का विमोचन OpenAI की कृत्रिम बुद्धिमत्ता क्षेत्र में निरंतर नवाचार को दर्शाता है, विशेष रूप से उपयोगकर्ता फीडबैक के प्रति प्रतिक्रिया, जो कंपनी की बाजार की मांग के प्रति संवेदनशीलता को दिखाता है। वयस्क मोड की लॉन्चिंग ने नेटिज़न्स के बीच गर्म चर्चा को जन्म दिया, जो एक अधिक खुला सामग्री निर्माण अनुभव लाने की उम्मीद कर रहे हैं।

【AiBase सारांश:】

🌟 OpenAI 2025 में AGI, बुद्धिमान कार्यों जैसे नए उत्पाद लॉन्च करने की योजना बना रहा है, जो कृत्रिम बुद्धिमत्ता क्षेत्र में निरंतर नवाचार को दर्शाता है।

💬 वयस्क मोड ने नेटिज़न्स का ध्यान आकर्षित किया, जो एक अधिक खुला सामग्री निर्माण अनुभव प्रदान करने की अपेक्षा कर रहे हैं।

📈 ऑल्टमैन की तकनीकी रिलीज़ उपयोगकर्ता फीडबैक से प्रेरित है, जो OpenAI के उत्पाद विकास में उपयोगकर्ता आवश्यकताओं के प्रति उसकी गंभीरता को दर्शाता है।

7. ज़ी युआन रोबोट ने दुनिया का पहला मिलियन वास्तविक मशीन डेटा सेट AgiBot World ओपन-सोर्स किया

ज़ी युआन रोबोट ने कई संस्थानों के साथ मिलकर AgiBot World डेटा सेट को ओपन-सोर्स किया है, जो दुनिया का पहला वास्तविक दृश्य पर आधारित मिलियन वास्तविक मशीन डेटा सेट है, जिसका उद्देश्य मानव आकार के रोबोट तकनीक के विकास को बढ़ावा देना है। इस डेटा सेट का आकार और गुणवत्ता मौजूदा समान उत्पादों से परे है, जिससे रोबोट बड़े मॉडल के प्रशिक्षण और अनुप्रयोग को बहुत बढ़ावा मिलेगा।

【AiBase सारांश:】

🌍 AgiBot World दुनिया का पहला वास्तविक दृश्य पर आधारित मिलियन वास्तविक मशीन डेटा सेट है, जो सामान्य और सामान्य रोबोट बड़े मॉडल प्रशिक्षण का समर्थन करता है।

📦 डेटा सेट में घरेलू, खाद्य सेवा, औद्योगिक आदि के पांच मुख्य दृश्य शामिल हैं, जिसमें 3000 से अधिक वास्तविक वस्तुएँ और 80 से अधिक कौशल वीडियो शामिल हैं।

📈 ज़ी युआन रोबोट भविष्य में दस लाख अनुकरण डेटा को ओपन-सोर्स करने की योजना बना रहा है, मानव आकार के रोबोट तकनीक के व्यापक अनुप्रयोग को बढ़ावा देने के लिए।

विवरण लिंक:https://github.com/OpenDriveLab/agibot-world

8. हगिंग फेस ने SmolAgents लॉन्च किया: तीन पंक्तियों के कोड से स्मार्ट एजेंट बनाना, AI विकास को सरल बनाना

हगिंग फेस का SmolAgents टूलकिट AI विकास में क्रांतिकारी बदलाव लाया है, जिससे स्मार्ट एजेंट का निर्माण पहले से कहीं अधिक सरल और कुशल हो गया है। केवल तीन पंक्तियों के कोड के माध्यम से, डेवलपर्स पूर्व-प्रशिक्षित मॉडलों का उपयोग करके शक्तिशाली स्मार्ट एजेंटों को जल्दी से बना सकते हैं, जिससे विकास की बाधाएँ बहुत कम हो जाती हैं। SmolAgents का हल्का डिज़ाइन और सहज API विभिन्न कौशल स्तर के डेवलपर्स को आसानी से आरंभ करने और जल्दी से कार्य पूरा करने में सक्षम बनाता है।

【AiBase सारांश:】

🚀 SmolAgents तीन पंक्तियों के कोड के माध्यम से स्मार्ट एजेंटों के निर्माण को सरल बनाता है, विकास की बाधाओं को कम करता है।

📊 यह टूलकिट पूर्व-प्रशिक्षित मॉडलों का उपयोग करता है, जो भाषा समझ, स्मार्ट खोज और गतिशील कोड निष्पादन जैसी क्षमताओं का समर्थन करता है।

💻 SmolAgents विभिन्न विकास परिदृश्यों के लिए उपयुक्त है, कार्य जल्दी से पूरा करता है, व्यक्तिगत डेवलपर्स और छोटे टीमों के लिए उपयुक्त है।

विवरण लिंक:https://github.com/huggingface/smolagents

9. शंघाई ने 9 नए पंजीकृत जनरेटिव आर्टिफिशियल इंटेलिजेंस सेवाएँ जोड़ी हैं

शंघाई साइबरस्पेस प्रशासन ने हाल ही में एक घोषणा जारी की, जिसमें 9 नई जनरेटिव आर्टिफिशियल इंटेलिजेंस सेवाओं का पंजीकरण किया गया, जिसका उद्देश्य शहर में जनरेटिव आर्टिफिशियल इंटेलिजेंस के नवाचार और मानक अनुप्रयोग को बढ़ावा देना है। इस पंजीकरण कार्य से कुल पंजीकरण संख्या 63 हो गई है, यह जोर देते हुए कि सभी ऑनलाइन सेवाओं को ऑनलाइन नंबर निर्दिष्ट करना आवश्यक है, ताकि पारदर्शिता और उपयोगकर्ता विश्वास को बढ़ाया जा सके। नई पंजीकृत सेवाओं में वुयू ज़ी मियान, AI समकालिक मौखिक अभ्यास आदि शामिल हैं, जिसका उद्देश्य उपयोगकर्ताओं को एक सुरक्षित और विश्वसनीय सेवा वातावरण प्रदान करना है।

【AiBase सारांश:】

📈 शंघाई ने 9 नई जनरेटिव आर्टिफिशियल इंटेलिजेंस सेवाएँ जोड़ी हैं, कुल पंजीकरण संख्या 63 तक पहुँच गई है, उद्योग के स्वस्थ विकास को बढ़ावा देती है।

🔍 सभी ऑनलाइन जनरेटिव आर्टिफिशियल इंटेलिजेंस अनुप्रयोगों को ऑनलाइन नंबर निर्दिष्ट करना आवश्यक है, सेवा पारदर्शिता को बढ़ावा देता है।

💡 नई सेवाएँ वुयू ज़ी मियान, AI समकालिक मौखिक अभ्यास आदि शामिल हैं, जो उपयोगकर्ताओं को सुरक्षित और विश्वसनीय अनुभव प्रदान करने का लक्ष्य रखते हैं।

10. अत्यधिक महंगा! OpenAI o3 मॉडल के लिए एक बार की पूछताछ की लागत 1000 डॉलर तक पहुँच गई!

OpenAI द्वारा हाल ही में लॉन्च किया गया o3AI मॉडल इसे सबसे शक्तिशाली आर्टिफिशियल इंटेलिजेंस उत्पाद माना गया है, लेकिन संचालन की लागत चौंका देने वाली है, एक बार के कार्य की लागत 1000 डॉलर से अधिक है। o3 ने ARC-AGI बेंचमार्क परीक्षण में उत्कृष्ट प्रदर्शन किया, जिसमें स्कोर 87.5% था, जो पिछले पीढ़ी के o1 मॉडल का लगभग तीन गुना है। हालाँकि, इस उल्लेखनीय प्रदर्शन में बड़ी लागत के साथ-साथ उद्योग में इसकी आर्थिकता पर चिंता पैदा कर दी है।

【AiBase सारांश:】

💸 o3AI मॉडल की एक बार की पूछताछ की लागत 1000 डॉलर से अधिक है, जो इसके संचालन की उच्च लागत को दर्शाता है।

📊 ARC-AGI बेंचमार्क परीक्षण में, o3 का स्कोर 87.5% था, जो पिछले पीढ़ी के o1 मॉडल का लगभग तीन गुना है।

🔍 वर्तमान में o3 को जनता के लिए जारी नहीं किया गया है, उम्मीद है कि "मिनी संस्करण" अगले साल जनवरी में लॉन्च किया जाएगा।

11. Nvidia ने Run:ai का सफलतापूर्वक अधिग्रहण किया और उसके GPU प्रबंधन सॉफ़्टवेयर को ओपन-सोर्स करने का निर्णय लिया