स्वागत है 【AI日报】 कॉलम में! यहाँ आपके लिए हर दिन आर्टिफिशियल इंटेलिजेंस की दुनिया की खोज करने का मार्गदर्शक है, हर दिन हम आपको AI क्षेत्र की हॉट सामग्री प्रस्तुत करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, जिससे आप तकनीकी प्रवृत्तियों को समझ सकें और नवाचार AI उत्पादों के अनुप्रयोगों को जान सकें।

ताज़ा AI उत्पादजानने के लिए क्लिक करें:https://top.aibase.com/

1. एप्पल WWDC ने गहरा बम गिराया GPT-4o के साथ Siri का पूरा परिवार जनरेटिव AI में आया

एप्पल ने 2024 के वैश्विक डेवलपर सम्मेलन WWDC में घोषणा की कि सभी उत्पाद जनरेटिव AI युग में प्रवेश कर रहे हैं, नया व्यक्तिगत स्मार्ट सिस्टम Apple Intelligence पेश किया। अपडेट का मूल है जनरेटिव AI मॉडल और उपयोगकर्ता प्रोफ़ाइल का बुद्धिमान सेवा के रूप में संयोजन, जो iOS18, iPadOS18 और macOS Sequoia में गहराई से एकीकृत है। Siri में बदलाव, जो अधिक समृद्ध भाषा समझने की क्षमता और क्रॉस-एप्लिकेशन कार्यों को निष्पादित करने की क्षमता रखता है। सिस्टम में ChatGPT को एकीकृत किया गया है जो छवि और दस्तावेज़ समझने की क्षमता प्रदान करता है, नए लेखन उपकरण और इमेज प्लेग्राउंड जैसी सुविधाएँ जोड़ी गई हैं।

image.png

【AiBase सारांश:】

🍎 Apple Intelligence जनरेटिव AI मॉडल और उपयोगकर्ता प्रोफ़ाइल को एकीकृत करता है, उपयोगी स्मार्ट सेवाएँ प्रदान करता है, जो iOS18, iPadOS18 और macOS Sequoia में गहराई से एकीकृत है।

🤖 Siri में बदलाव, अधिक समृद्ध भाषा समझने की क्षमता, क्रॉस-एप्लिकेशन कार्यों का समर्थन, उपयोगकर्ता टाइप करके Siri से संवाद कर सकते हैं।

📸 सिस्टम में ChatGPT को एकीकृत किया गया है जो छवि और दस्तावेज़ समझने की क्षमता प्रदान करता है, नए लेखन उपकरण और इमेज प्लेग्राउंड जोड़े गए हैं, उपयोगकर्ता एनिमेशन, चित्र या स्केच शैली की छवियाँ बना सकते हैं।

विवरण: https://www.chinaz.com/2024/0611/1622511.shtml

2. एप्पल और गूगल Gemini मॉडलका सहयोग

एप्पल ने गूगल के Gemini मॉडल के साथ सहयोग की घोषणा की, तीसरे पक्ष के मॉडल के लिए पहुँच खोली, जिससे उपयोगकर्ताओं को अधिक विकल्प मिलेंगे। Siri ChatGPT को एकीकृत करेगा, उपयोगकर्ता बिना Siri छोड़े बातचीत कर सकते हैं, और गोपनीयता नियंत्रण बनाए रख सकते हैं। एप्पल ने डेवलपमेंट किट को अपडेट किया, पहली बार OpenAI के ChatGPT को शामिल किया, साथ ही नई सुविधाएँ और अपडेट जारी किए।

【AiBase सारांश:】

🍎 एप्पल और गूगल Gemini मॉडल का सहयोग, तीसरे पक्ष के मॉडल के लिए पहुँच खोली, आर्टिफिशियल इंटेलिजेंस पारिस्थितिकी तंत्र का विस्तार।

🤖 Siri में ChatGPT को एकीकृत किया गया, उपयोगकर्ता Siri में बातचीत कर सकते हैं, गोपनीयता नियंत्रण बनाए रख सकते हैं।

🚀 एप्पल ने डेवलपमेंट किट को अपडेट किया, पहली बार OpenAI के ChatGPT को शामिल किया, iOS18 की नई सुविधाएँ और VisionOS2 जारी किया।

3. iOS18 फ़ोटो ऐप का बड़ा सुधार: AI हटाने की नई सुविधा, स्मार्ट फ़िल्टरिंग खोज को संकुचित करता है

एप्पल ने हाल ही में जारी किए गए iOS18 सिस्टम में SMS फ़ंक्शन में व्यापक सुधार किया है। उपयोगकर्ता न केवल SMS सामग्री में अंडरलाइन और स्ट्राइकथ्रू जोड़ सकते हैं, बल्कि कई गतिशील टेक्स्ट प्रभाव भी लागू कर सकते हैं, जिससे प्रत्येक संदेश को व्यक्तिगतता मिलती है।

【AiBase सारांश:】

⭐️ एप्पल ने OpenAI के साथ सहयोग किया है, iOS18 में ChatGPT फ़ंक्शन पेश किया जाएगा।

🤖 GPT-4 द्वारा उत्पन्न वर्णनात्मक अंतर्दृष्टि भविष्य के स्टॉक प्रदर्शन के लिए जानकारीपूर्ण है।

💬 iPadOS18 सिस्टम iOS18 पर विभिन्न कस्टम फ़ीचर्स के साथ-साथ कस्टम एप्लिकेशन में सामान्य कार्यों की बार भी समर्थन करता है।

iOS18 के लिए उपयुक्त मॉडल यहाँ देखें: https://www.chinaz.com/2024/0611/1622488.shtml

4. टेनसेंट ने नया चित्र-से-वीडियो मॉडल Follow-Your-Pose-v2 पेश किया

यह लेख टेनसेंट की ह्युआन टीम द्वारा ज़ोंगशान यूनिवर्सिटी और हांगकांग टेक्नोलॉजिकल यूनिवर्सिटी के सहयोग से विकसित किए गए नए चित्र-से-वीडियो मॉडल "Follow-Your-Pose-v2" के बारे में है, जो बहु-व्यक्ति वीडियो क्रियाएँ उत्पन्न करने, मजबूत सामान्यीकरण क्षमता और व्यक्तियों के छिपने को सही तरीके से संभालने जैसे विशेषताओं को प्राप्त करता है। यह मॉडल वीडियो निर्माण के क्षेत्र में महत्वपूर्ण है, और इसके उपयोग की संभावनाएँ व्यापक हैं।

image.png

【AiBase सारांश:】

🌟 बहु-व्यक्ति वीडियो क्रियाएँ उत्पन्न करने का समर्थन करता है, बहु-व्यक्ति वीडियो क्रियाओं का निर्माण करता है, अनुमानित समय कम करता है।

🔥 मजबूत सामान्यीकरण क्षमता, चाहे उम्र, कपड़े, जाति, पृष्ठभूमि की जटिलता या क्रियाओं की जटिलता कुछ भी हो, उच्च गुणवत्ता वाले वीडियो उत्पन्न कर सकता है।

💡 व्यक्तियों के छिपने को सही तरीके से संभालता है, सही आगे-पीछे संबंधों के साथ छिपे हुए चित्र उत्पन्न कर सकता है।

प्रोजेक्ट पृष्ठ: https://top.aibase.com/tool/follow-your-pose

पेपर का लिंक: https://arxiv.org/pdf/2406.03035

5. MotionFollower: वीडियो पृष्ठभूमि को बदले बिना व्यक्तियों की क्रियाएँ पुन: उत्पन्न करता है

MotionFollower एक नवोन्मेषी तकनीक है, जो एक वीडियो में गति को दूसरे वीडियो में व्यक्तियों पर कॉपी कर सकती है, व्यक्तियों की उपस्थिति को बिना बदले। यह तकनीक व्यापक रूप से उपयोग की जाती है, जैसे कि फिल्म निर्माण, विज्ञापन निर्माण, गेम विकास आदि क्षेत्रों में।

【AiBase सारांश:】

⚙️ MotionFollower एक नवोन्मेषी तकनीक है, जो वीडियो में गति को दूसरे व्यक्तियों पर कॉपी करती है, उपस्थिति को बिना बदले।

🌐 उपयोग के व्यापक क्षेत्र, जैसे कि फिल्म, विज्ञापन, गेम आदि में।

🎥 MotionFollower बड़े पैमाने पर कैमरा गति वाले वीडियो को संभालता है, उच्च गुणवत्ता वाली गति जानकारी का स्थानांतरण करता है।

विवरण लिंक: https://top.aibase.com/tool/motionfollower

6. एडेबो ने सेवा की शर्तें संशोधित की, स्पष्ट किया कि वह ग्राहक के काम का AI प्रशिक्षण में उपयोग नहीं करेगा

एडेबो ने सेवा की शर्तों को फिर से संशोधित करने की घोषणा की, स्पष्ट किया कि वह ग्राहक के काम का AI प्रशिक्षण में उपयोग नहीं करेगा, जिसका उद्देश्य उपयोगकर्ताओं का विश्वास वापस जीतना है। यह परिवर्तन एक सप्ताह पहले उपयोगकर्ताओं के तीव्र विरोध के बाद घोषित किया गया था।

【AiBase सारांश:】

🛡️ एडेबो ने सेवा की शर्तों को संशोधित किया, स्पष्ट किया कि वह ग्राहक के काम का AI प्रशिक्षण में उपयोग नहीं करेगा।

💬 एडेबो के अध्यक्ष ने स्वीकार किया कि सेवा की शर्तों को समय पर स्पष्ट किया जाना चाहिए था, और अधिक पारदर्शी होने का वादा किया।

🖼️ रचनाकारों की एडेबो के प्रति चिंताएँ बनी हुई हैं, कंपनी विश्वास वापस जीतने की कोशिश कर रही है।

7. OpenAI ने ChatGPT की आवाज़ की क्षमता को अपडेट किया, जिससे यह विभिन्न पात्रों की आवाज़ में बात कर सके

OpenAI ने हाल ही में ChatGPT की आवाज़ की क्षमता को अपडेट किया, जिससे उपयोगकर्ताओं को चैटबॉट के साथ बातचीत करने के लिए विभिन्न AI उत्पन्न आवाज़ों और आवाज़ की शैलियों का उपयोग करने की अनुमति मिली। नई सुविधा उपयोगकर्ताओं को AI चैटबॉट को किसी भी आवाज़ का उपयोग करने का निर्देश देने की अनुमति देती है, जिससे इंटरैक्टिविटी और पहुँच में वृद्धि होती है।

image.png

【AiBase सारांश:】

🔊 ChatGPT के पास अब चार पूर्वनिर्धारित आवाज़ें हैं, जो आवाज़ की शैली को वास्तविक समय में अनुकूलित करती हैं।

🗣️ उपयोगकर्ता AI से कह सकते हैं कि वह कहानी के पात्रों के लिए आवाज़ करे, जैसे शेर की गर्जना जैसी अद्वितीय आवाज़ उत्पन्न करे।

🔜 OpenAI अगले कुछ हफ्तों में नई आवाज़ की क्षमता पेश करेगा, सभी ChatGPT उपयोगकर्ताओं के लिए उपलब्ध, प्रीमियम सब्सक्राइबर को प्राथमिकता दी जाएगी।

8. Instant3D को मात देने के लिए! शंघाई जियाओटोंग यूनिवर्सिटी ने नया ढांचा Bootstrap3D पेश किया, 3D उत्पादन क्षमता को महत्वपूर्ण रूप से बढ़ाया

शंघाई जियाओटोंग यूनिवर्सिटी और हांगकांग चाइनीज यूनिवर्सिटी के शोध दल ने Bootstrap3D नामक एक नए ढांचे को पेश किया है, जो समायोजित 3D धारणा बहु-मोडल बड़े मॉडल को संयोजित करके उच्च गुणवत्ता वाली बहु-दृश्य चित्र डेटा को स्वचालित रूप से उत्पन्न कर सकता है, 3D उत्पादन मॉडल की क्षमता को महत्वपूर्ण रूप से बढ़ाता है। इस ढांचे का संश्लेषण डेटा सेट पूरी तरह से ओपन-सोर्स है, शोधकर्ताओं और डेवलपर्स के लिए मुफ्त उपयोग के लिए उपलब्ध है। इस ढांचे की प्रमुख विशेषताएँ डेटा निर्माण पाइपलाइन, पाठ संकेत उत्पन्न करना, छवि उत्पन्न करना, बहु-दृश्य संश्लेषण, गुणवत्ता चयन और विवरण पुनःलेखन आदि हैं। शोध दल ने शोर को हटाने की प्रक्रिया के विभिन्न चरणों का अनुकूलन करने के लिए प्रशिक्षण टाइमस्टेप पुनर्व्यवस्था (TTR) रणनीति भी प्रस्तुत की, जो बहु-दृश्य प्रसार मॉडल के प्रशिक्षण में समस्याओं को हल करती है। प्रयोगात्मक परिणाम दर्शाते हैं कि TTR रणनीति का उपयोग करने वाले बहु-दृश्य प्रसार मॉडल छवि-टेक्स्ट संरेखण, छवि गुणवत्ता और दृश्य स्थिरता के संदर्भ में उत्कृष्ट प्रदर्शन करते हैं, और बहु-दृश्य उत्पादन के प्रभाव को प्रभावी ढंग से बढ़ाते हैं।

【AiBase सारांश:】

🔑 डेटा निर्माण पाइपलाइन: स्वचालित रूप से बहु-दृश्य चित्र डेटा और विस्तृत विवरण पाठ उत्पन्न करना, ढांचे का एक प्रमुख नवाचार है।

🔑 पाठ संकेत उत्पन्न करना: बड़े भाषा मॉडल का उपयोग करके रचनात्मक और विविध पाठ संकेत उत्पन्न करना, छवि उत्पन्न करने के लिए सामग्री प्रदान करना।

🔑 बहु-दृश्य संश्लेषण: एकल दृश्य छवि को बहु-दृश्य छवि में विस्तारित करना, विभिन्न दृश्यों के तहत स्थिरता सुनिश्चित करना।

विवरण लिंक: https://top.aibase.com/tool/bootstrap3d

9. गूगल ने AGREE ढांचा लॉन्च किया, बड़े भाषा मॉडल के द्वारा उत्पन्न सामग्री की सटीकता को बढ़ाने के लिए

गूगल रिसर्च इंस्टीट्यूट ने AGREE ढांचा लॉन्च किया, जिसका उद्देश्य बड़े भाषा मॉडल द्वारा उत्पन्न सामग्री और संदर्भ की सटीकता को बढ़ाना है। यह ढांचा उत्तर की सटीकता को बढ़ाने के लिए संबंधित पैराग्राफ को पुनः प्राप्त करता है, और उपयोगकर्ताओं को जानकारी की सत्यता को सत्यापित करने का एक तरीका प्रदान करता है। मुख्य तकनीक में प्रशिक्षण चरण का सूक्ष्म समायोजन और परीक्षण के समय अनुकूलन शामिल है। प्रयोगात्मक परिणाम दिखाते हैं कि AGREE सामग्री उत्तर की सटीकता और संदर्भ में सुधार करने में उत्कृष्ट प्रदर्शन करता है।

image.png

【AiBase सारांश:】

🔍 AGREE ढांचा बड़े भाषा मॉडल द्वारा उत्पन्न सामग्री और संदर्भ की सटीकता को बढ़ाने के लिए है।

🎯 मुख्य तकनीक में प्रशिक्षण चरण का सूक्ष्म समायोजन और परीक्षण के समय अनुकूलन शामिल है।

💡 प्रयोगात्मक परिणाम दिखाते हैं कि AGREE सामग्री उत्तर की सटीकता और संदर्भ में सुधार करने में उत्कृष्ट प्रदर्शन करता है।

विवरण लिंक: https://arxiv.org/pdf/2311.09533

10.粉笔 अगस्त में अपने स्वयं के AI स्मार्ट शिक्षक को लॉन्च करेगा

粉笔 समूह अगस्त 2024 में अपने स्वयं के AI स्मार्ट शिक्षक को लॉन्च करेगा, जो इसके ऑनलाइन प्लेटफॉर्म द्वारा प्रदान किए गए AI अध्ययन उपकरणों में से एक बन जाएगा, पहले इसे राष्ट्रीय या प्रांतीय भर्ती और योग्यता परीक्षा प्रणाली कक्षाओं में लागू किया जाएगा।

【AIBase सारांश:】

⭐️ 粉笔 समूह अगस्त 2024 में अपने स्वयं के AI स्मार्ट शिक्षक को लॉन्च करेगा।

⭐️ AI स्मार्ट शिक्षक 粉笔 के ऑनलाइन प्लेटफॉर्म द्वारा प्रदान किए गए AI अध्ययन उपकरणों में से एक होगा।

⭐️ पहले इसे राष्ट्रीय या प्रांतीय भर्ती और योग्यता परीक्षा प्रणाली कक्षाओं में लागू किया जाएगा।