【AI日报】栏目 में आपका स्वागत है! यहां आपके लिए हर दिन आर्टिफिशियल इंटेलिजेंस की दुनिया का अन्वेषण करने का मार्गदर्शन है। हम हर दिन AI क्षेत्र की प्रमुख सामग्री प्रस्तुत करते हैं, जो डेवलपर्स पर केंद्रित है, ताकि आप तकनीकी प्रवृत्तियों को समझ सकें और नवाचार AI उत्पादों के अनुप्रयोगों के बारे में जान सकें।

नए AI उत्पादजानने के लिए क्लिक करें:https://top.aibase.com/

1. अलीबाबा ने नवीनतम गणितीय मॉडल Qwen2-Math जारी किया, जिसकी गणितीय क्षमताएं GPT-4o को मात देती हैं।

अलीबाबा क्लाउड द्वारा पेश किए गए Qwen2-Math श्रृंखला के बड़े भाषा मॉडल ने गणित के क्षेत्र में मजबूत समस्या समाधान क्षमताएं प्रदर्शित की हैं, जो ओपन-सोर्स और क्लोज्ड-सोर्स मॉडल से आगे निकल गई हैं और AI गणित के क्षेत्र में एक काले घोड़े के रूप में उभरी है। यह मॉडल एक सावधानीपूर्वक डिज़ाइन की गई गणितीय पेशेवर कॉर्पस पर गहरे पूर्व-प्रशिक्षण के माध्यम से विकसित किया गया है, विशेष रूप से Qwen2-Math-Instruct मॉडल ने गणितीय समस्या समाधान क्षमताओं को बढ़ाने के लिए नवोन्मेषी प्रशिक्षण विधियों का उपयोग किया है। भविष्य में, टीम बहुभाषी संस्करण पेश करने और मॉडल को लगातार अनुकूलित करने की योजना बना रही है। Qwen2-Math की उपस्थिति AI के लिए गणित के क्षेत्र में नए अनुप्रयोगों की संभावनाओं को खोलती है, जो शिक्षा, अनुसंधान, और इंजीनियरिंग जैसे क्षेत्रों में महत्वपूर्ण भूमिका निभाएगी।

image.png

【AiBase सारांश:】

⚙️ Qwen2-Math श्रृंखला के मॉडल ने मजबूत गणितीय समस्या समाधान क्षमताओं का प्रदर्शन किया है, जो ओपन-सोर्स और क्लोज्ड-सोर्स मॉडल से आगे निकल गई है।

📚 Qwen2-Math एक सावधानीपूर्वक डिज़ाइन की गई गणितीय पेशेवर कॉर्पस पर गहरे पूर्व-प्रशिक्षण के आधार पर विकसित किया गया है, विशेष रूप से Qwen2-Math-Instruct मॉडल ने नवोन्मेषी प्रशिक्षण विधियों का उपयोग किया है।

💡 अलीबाबा क्लाउड टीम बहुभाषी Qwen2-Math संस्करण पेश करने की योजना बना रही है और अधिक जटिल गणितीय समस्याओं को हल करने के लिए मॉडल को लगातार अनुकूलित कर रही है।

विवरण लिंक: https://top.aibase.com/tool/qwen2-math

2. बाइटडांस का AI सहायक डौबाओ ऐप और डेस्कटॉप संस्करण ने संगीत उत्पादन की सुविधा शुरू की।

हाल ही में, बाइटडांस के डौबाओ AI सहायक ने संगीत उत्पादन की सुविधा लॉन्च की, जिससे उपयोगकर्ता आसानी से अनूठे गाने बना सकते हैं। यह सेवा विभिन्न संगीत शैलियों और भावनात्मक अवस्थाओं की पेशकश करती है, जिसका उद्देश्य उपयोगकर्ताओं की भावनात्मक अभिव्यक्ति की जरूरतों को पूरा करना है। डौबाओ संगीत के माध्यम से रचनात्मकता को प्रेरित करना चाहता है, जिससे उपयोगकर्ता अपनी कहानियों को साझा कर सकें और संगीत निर्माण की यात्रा शुरू कर सकें।

image.png

【AiBase सारांश:】

🎶 उपयोगकर्ता डौबाओ ऐप या डेस्कटॉप संस्करण में अनूठे गाने उत्पन्न कर सकते हैं, जिसमें वे गाने की शैली, वातावरण और आवाज़ का चयन कर सकते हैं, और गीत 200 शब्दों के भीतर सीमित होते हैं।

🎵 11 विभिन्न संगीत शैलियों और कई भावनात्मक अवस्थाओं के विकल्प उपलब्ध हैं, जिसमें लोक, हिप-हॉप, R&B शामिल हैं, उपयोगकर्ता पुरुष या महिला आवाज़ का चयन कर सकते हैं।

🎤 उपयोगकर्ता एक क्लिक में पूर्ण गीत उत्पन्न कर सकते हैं, और उत्पन्न गाने और कवर को डाउनलोड और साझा कर सकते हैं। संगीत उत्पादन की सुविधा लगातार सुधार के अधीन है, डौबाओ उपयोगकर्ताओं को संगीत के माध्यम से कहानियां साझा करने और रचनात्मकता को प्रेरित करने के लिए प्रोत्साहित करता है।

3. चटक चटक! ChatGPT अब मुफ्त उपयोगकर्ताओं को DALL-E3 द्वारा निर्मित दो चित्र प्रतिदिन उत्पन्न करने की अनुमति देता है।

OpenAI ने घोषणा की है कि मुफ्त उपयोगकर्ता अब DALL-E3 मॉडल का उपयोग करके प्रतिदिन अधिकतम दो चित्र उत्पन्न कर सकते हैं, जिससे उपयोगकर्ताओं को अधिक रचनात्मक संभावनाएं मिलती हैं। DALL-E3 ChatGPT द्वारा उत्पन्न संकेतों का उपयोग करके चित्र बनाने में सक्षम है, जिससे उपयोगकर्ताओं के लिए शुरुआत करना आसान हो जाता है। नई सुविधा धीरे-धीरे शुरू की जा रही है, कुछ उपयोगकर्ताओं ने सुविधाजनक रचनात्मक अनुभव का अनुभव किया है, जो अधिक रचनाकारों की प्रेरणा को बढ़ावा देता है।

image.png

【AiBase सारांश:】

🌟 ChatGPT के मुफ्त उपयोगकर्ता प्रतिदिन दो DALL-E3 चित्र उत्पन्न कर सकते हैं!

🎨 DALL-E3 द्वारा ChatGPT से उत्पन्न संकेतों के माध्यम से चित्र निर्माण को और सरल बनाया गया है।

📅 यह सुविधा धीरे-धीरे शुरू की जा रही है, कुछ उपयोगकर्ताओं ने इस नई सुविधा का अनुभव किया है।

4. एप्पल ने मात्रीशका डिफ्यूजन मॉडल MDM पेश किया।

एप्पल द्वारा हाल ही में पेश किया गया मात्रीशका डिफ्यूजन मॉडल (MDM) अपनी तकनीकी नवाचार क्षमता को प्रदर्शित करता है, जो मात्रीशका के सिद्धांत के माध्यम से चित्र और वीडियो का निर्बाध निर्माण करता है, चित्र की गुणवत्ता और निर्माण की दक्षता में सुधार करता है, और AI चित्र निर्माण के क्षेत्र में नई तकनीकी प्रवृत्तियों को लाता है।

image.png

【AiBase सारांश:】

🎨 MDM मात्रीशका डिफ्यूजन मॉडल का उपयोग करता है, विभिन्न रिज़ॉल्यूशन पर चित्र संसाधित करता है और उच्च गुणवत्ता वाले चित्र उत्पन्न करता है।

🧠 MDM का मुख्य ढांचा NestedUNet मात्रीशका सिद्धांत को मजबूत करता है, छोटे पैमाने पर इनपुट को क्रमिक रूप से संसाधित करता है, जिससे सीखने और निर्माण की दक्षता में सुधार होता है।

✨ MDM उच्च रिज़ॉल्यूशन चित्र निर्माण में उत्कृष्टता दिखाता है, जिसमें शून्य नमूना सामान्यीकरण क्षमता है, जो AI चित्र निर्माण तकनीक के अनुप्रयोग क्षेत्र को बढ़ाता है।

विवरण लिंक: https://top.aibase.com/tool/ml-mdm

5. GPT-4o अचानक रात में अजीब आवाजें निकालता है? OpenAI ने 32 पृष्ठों की सुरक्षा रिपोर्ट जारी की।

एक नई "रेड टीम" रिपोर्ट में, OpenAI ने GPT-4o मॉडल के लाभों और जोखिमों की जांच की और GPT-4o की कुछ अजीब विशेषताओं का खुलासा किया। रिपोर्ट विभिन्न शमन उपायों और सुरक्षा उपायों के माध्यम से एक सुरक्षित AI मॉडल का समग्र चित्र प्रस्तुत करती है।

【AiBase सारांश:】

🔍 GPT-4o उच्च पृष्ठभूमि शोर वाले वातावरण में उपयोगकर्ता की आवाज़ की नकल करता है।

🔊 GPT-4o परेशान करने वाली गैर-शाब्दिक ध्वनियाँ और ध्वनि प्रभाव उत्पन्न करता है।

🎵 GPT-4o संगीत कॉपीराइट का उल्लंघन कर सकता है।

विवरण लिंक:

https://openai.com/index/gpt-4o-system-card/ 

https://techcrunch.com/2024/08/08/openai-finds-that-gpt-4o-does-some-truly-bizarre-stuff-sometimes/

6. बाइटडांस डौबाओ बड़े मॉडल ने वास्तविक समय की आवाज़ कॉल का समर्थन किया।

बाइटडांस के क्लाउड सेवा प्लेटफॉर्म वोल्केन इंजन ने घोषणा की है कि डौबाओ बड़े मॉडल ने नए वास्तविक समय की आवाज़ कॉल फ़ीचर का समर्थन किया है। वोल्केन इंजन द्वारा प्रदान किए गए संवादात्मक AI वास्तविक समय इंटरएक्टिव समाधान ने आवाज़ से टेक्स्ट और टेक्स्ट से आवाज़ रूपांतरण प्रक्रिया को सरल बनाया है, जिससे आवाज़ डेटा संग्रहण, प्रसंस्करण और ट्रांसमिशन की दक्षता बढ़ाई जा रही है, जो उत्कृष्ट बुद्धिमान संवाद और प्राकृतिक भाषा प्रसंस्करण क्षमताएं प्रदान करती है। वोल्केन इंजन का बड़ा मॉडल बहु-मोडल वास्तविक समय इंटरएक्टिव सेवा प्रमुख AI वर्चुअल व्यक्तित्व चैट एप्लिकेशन को AI वास्तविक समय की आवाज़ क्षमता प्रदान करता है, जिससे एक नई इंटरएक्टिव अनुभव मिलता है।

【AiBase सारांश:】

🔥 वोल्केन इंजन वास्तविक समय की आवाज़ कॉल का नया फ़ीचर प्रदान करता है, जो आवाज़ से टेक्स्ट और टेक्स्ट से आवाज़ रूपांतरण प्रक्रिया को सरल बनाता है, और प्रभावी आवाज़ डेटा प्रसंस्करण और ट्रांसमिशन प्रदान करता है।

🚀 वोल्केन इंजन RTC ऑडियो 3A प्रोसेसिंग तकनीक पर आधारित है, "डुअल स्पीक" घटना को हल करता है, जिससे आवाज़ पहचान की सटीकता और वास्तविकता सुनिश्चित होती है।

💡 वोल्केन इंजन लचीले और विविधता से भरे प्रवेश समाधान प्रदान करता है, विभिन्न कंपनियों की जरूरतों को पूरा करता है, और कंपनियों को नवोन्मेषी AI वास्तविक समय ऑडियो-वीडियो अनुभव प्रदान करता है।

7. एप्पल या Apple Intelligence उच्च स्तरीय AI सेवा लॉन्च कर सकता है।

एप्पल ने एक नई Apple Intelligence सेवा पेश करने की योजना बनाई है, जो AI क्षेत्र में इसकी साहसिक कोशिश होगी। यह सेवा प्रति माह 20 डॉलर तक की कीमत पर उपयोगकर्ताओं के लिए उपलब्ध हो सकती है, जो एप्पल की AI तकनीक पर विश्वास और सेवा क्षेत्र में विस्तार की महत्वाकांक्षा को दर्शाती है। हालांकि अभी तक इसकी आधिकारिक पुष्टि नहीं हुई है, लेकिन यदि यह सफल होती है, तो उपयोगकर्ता उच्च स्तर की, व्यक्तिगत AI सेवाओं का आनंद ले सकेंगे, जिससे एप्पल की तकनीकी सेवा बाजार में नेतृत्व की स्थिति मजबूत होगी।

image.png

【AiBase सारांश:】

🚀 एप्पल नई Apple Intelligence सेवा पेश करने की योजना बना रहा है, जिसकी मासिक शुल्क 20 डॉलर तक हो सकती है।

💡 एप्पल AI तकनीक की लागत उपयोगकर्ताओं पर डालने की योजना बना रहा है, जो AI तकनीक पर विश्वास को दर्शाता है।

💰 यह मौजूदा Apple One सेवा पैकेज में एकीकृत किया जा सकता है, जिससे एप्पल की तकनीकी सेवा बाजार में नेतृत्व की स्थिति और मजबूत होगी।

8. गूगल रोबोट ने पेरिस ओलंपिक में चुनौती दी, फॉरहैंड और बैकहैंड में लचीलापन दिखाया, और पेशेवर प्रशिक्षकों को हराया।

एक पिंग-पोंग उत्साही के रूप में, मैं गूगल के रोबोट एजेंट के पिंग-पोंग मैच में प्रदर्शन से प्रभावित हूं। यह रोबोट न केवल उच्च कौशल का धनी है, बल्कि यह मानव खिलाड़ियों के साथ तीव्र मुकाबला कर सकता है, जो रोबोट तकनीक की विशाल संभावनाओं को दर्शाता है।

【AiBase सारांश:】

🏓 गूगल ने मानव प्रतिस्पर्धा स्तर तक पहुँचने वाला पहला रोबोट एजेंट पेश किया है, जो पिंग-पोंग प्रतियोगिता में चुनौती देता है।

🔥 रोबोट ने पिंग-पोंग स्थिति डेटा का एक बड़ा मात्रा में अध्ययन करके फॉरहैंड टॉपस्पिन, बैकहैंड टारगेटिंग जैसे कौशल सीखे हैं, और तेज गति और वास्तविक समय की सटीकता प्रदर्शित की है।

🤖 रोबोट ने विभिन्न कौशल स्तर के खिलाड़ियों के साथ मुकाबले में कुछ सफलता प्राप्त की है, जो मानव प्रतिद्वंद्वियों के साथ सीधे प्रतिस्पर्धा की क्षमता को दर्शाता है।

विवरण लिंक: https://sites.google.com/view/competitive-robot-table-tennis/home

9. Zhijidongli ने नवीनतम मानवाकार रोबोट CL-1 लॉन्च किया, जो डिलीवरी स्टेशनों पर सामान उठाने में मदद कर सकता है।

Zhijidongli द्वारा हाल ही में पेश किया गया मानवाकार रोबोट CL-1 उत्कृष्ट आत्म-चालन और कार्य निष्पादन क्षमताओं को प्रदर्शित करता है, जो स्मार्ट रोबोटिक्स के क्षेत्र में विकास का नेतृत्व कर रहा है। कंपनी ने ए राउंड फंडिंग पूरी की है, जो पूंजी बाजार में मान्यता प्राप्त की है, और अलीबाबा जैसे दिग्गजों का निवेश ध्यान आकर्षित कर रहा है। CL-1 ने सामान को स्थिरता से पकड़ने और ले जाने की क्षमता प्रदर्शित की है, जो चीन के स्मार्ट रोबोटिक्स की प्रतिस्पर्धात्मकता को बढ़ाती है। भविष्य में, Zhijidongli स्मार्ट निर्माण और लॉजिस्टिक्स क्षेत्रों में अधिक महत्वपूर्ण भूमिका निभाने की उम्मीद कर रहा है, जिससे नवाचार और परिवर्तन आएंगे।

【AiBase सारांश:】

🤖 CL-1 उत्कृष्ट आत्म-चालन और कार्य निष्पादन क्षमताओं को प्रदर्शित करता है।

💰 Zhijidongli ने ए राउंड फंडिंग पूरी की, जिसमें अरबों युआन का निवेश हुआ।

🚚 CL-1 ने सामान को स्थिरता से पकड़ने और ले जाने की क्षमता प्रदर्शित की, जो चीन के स्मार्ट रोबोटिक्स की प्रतिस्पर्धात्मकता को बढ़ाती है।

10. लेई जून: Xiaomi के प्रमुख उपकरण अंतरराष्ट्रीय संस्करण में गूगल AI बड़े मॉडल Google Gemini का समावेश होगा।

लेई जून ने घोषणा की है कि Xiaomi के प्रमुख उपकरणों के अंतरराष्ट्रीय संस्करण में गूगल AI बड़े मॉडल Google Gemini का समावेश किया जाएगा, जिसका उद्देश्य उपयोगकर्ताओं को अधिक बुद्धिमान और सहज अनुभव प्रदान करना है। यह कदम Xiaomi फोन को उन्नत बहु-मोडल AI क्षमताएं प्रदान करेगा, जिससे उपयोगकर्ता अनुभव और कार्यक्षमता में सुधार होगा।

【AiBase सारांश:】

🔍 Google Gemini एक उन्नत बहु-मोडल AI मॉडल है, जो चित्र, ऑडियो, वीडियो को गहराई से समझने में सक्षम है और गणितीय तर्क क्षमता रखता है।

🚀 Gemini ने कई क्षेत्रों में उत्कृष्ट प्रदर्शन दिखाया है, OpenAI के GPT-4 मॉडल को पीछे छोड़ते हुए, जिसमें प्राकृतिक चित्र समझ, ऑडियो प्रसंस्करण, गणितीय तर्क आदि शामिल हैं।

📱 Xiaomi 15 श्रृंखला का अंतरराष्ट्रीय संस्करण Google Gemini AI बड़े मॉडल के साथ लॉन्च होने की उम्मीद है, जो अक्टूबर में उपयोगकर्ताओं को नवीनतम AI तकनीक का अनुभव प्रदान करेगा।