आपका स्वागत है 【AI दैनिक】 कॉलम में! यहाँ आपके लिए हर दिन आर्टिफिशियल इंटेलिजेंस की दुनिया की खोज करने का गाइड है। हर दिन हम आपको AI क्षेत्र की प्रमुख सामग्री प्रस्तुत करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, ताकि आप तकनीकी रुझानों को समझ सकें और नवीन AI उत्पादों के अनुप्रयोगों को जान सकें।

नए AI उत्पादों के लिए जानकारी के लिए क्लिक करें: https://top.aibase.com/

1. शांगतॉन्ग टेक्नोलॉजी ने Vimi वीडियो जनरेटिंग बड़े मॉडल का अनावरण किया, C-साइड एप्लिकेशन Vimi कैमरा का ओपन बीटा परीक्षण शुरू किया

शांगतॉन्ग टेक्नोलॉजी ने 2024 विश्व आर्टिफिशियल इंटेलिजेंस सम्मेलन (WAIC) में Vimi वीडियो जनरेटिंग बड़े मॉडल का अनावरण किया, जो उपयोगकर्ताओं को सटीक भावनाओं और शारीरिक नियंत्रण प्रदान करता है। यह कई ड्राइविंग तरीकों का समर्थन करता है, इसकी स्थिरता उत्कृष्ट है और यह उच्च संगतता वाले वीडियो सामग्री उत्पन्न कर सकता है। Vimi कैमरा पहले C-साइड एप्लिकेशन के रूप में, महिलाओं उपयोगकर्ताओं की मनोरंजन रचनात्मकता की जरूरतों को पूरा करता है, विभिन्न जनरेशन शैलियों और व्यक्तिगत रचनाओं का समर्थन करता है।

image.png

【AiBase सारांश:】

👩‍💻 Vimi मॉडल शांगतॉन्ग की उन्नत बड़े मॉडल तकनीक का उपयोग करता है, जो लक्ष्य क्रियाओं के अनुरूप व्यक्तित्व वीडियो उत्पन्न कर सकता है, जिसमें वर्षों का चेहरा ट्रैकिंग तकनीक और सटीक नियंत्रण क्षमता शामिल है।

🎥 Vimi एकल शॉट व्यक्तित्व वीडियो उत्पन्न कर सकता है जो एक मिनट से अधिक लंबा है, और समय के साथ चित्र गुणवत्ता में कमी नहीं आती है, पर्यावरण दृश्य समायोजन और यथार्थवादी दृश्य प्रभाव अनुकरण का समर्थन करता है।

📸 Vimi कैमरा उपयोगकर्ताओं को एचडी व्यक्तित्व चित्र अपलोड करने की अनुमति देता है, जिससे डिजिटल अवतार और पोर्ट्रेट वीडियो उत्पन्न होते हैं, जो विभिन्न जनरेशन शैलियों और मजेदार व्यक्तित्व इमोजी पैक प्रदान करते हैं।

2. सीमित समय के लिए मुफ्त! Tencent Zhiying मिनी प्रोग्राम ने "AI वीडियो" सुविधा लॉन्च की

Zhiying मिनी प्रोग्राम ने "AI वीडियो" नामक नई सुविधा लॉन्च की है, जो उपयोगकर्ताओं को एक क्लिक में सामान्य वीडियो को स्टाइलाइज्ड वीडियो में बदलने की अनुमति देती है, विशेष रूप से एनीमे शैली में, वीडियो की आकर्षण को बढ़ाने के लिए। यह सुविधा वर्तमान में सीमित समय के लिए मुफ्त है, जिसका उद्देश्य उपयोगकर्ताओं को वीडियो की सुंदरता और मनोरंजन को बढ़ाना है।

image.png

【AiBase सारांश:】

🎥 एक-क्लिक ऑपरेशन: जल्दी से शुरू करें, यहां तक कि शुरुआती लोग भी पेशेवर स्तर के स्टाइलाइज्ड वीडियो बना सकते हैं।

🎨 विभिन्न शैली टेम्पलेट्स: विविध टेम्पलेट्स प्रदान करते हैं, जो वीडियो की सुंदरता और कहानी की गहराई को बढ़ाते हैं।

🚀 वीडियो प्रसार को बढ़ावा दें: स्टाइलाइज्ड वीडियो को साझा करना आसान है, जिससे अधिक दर्शकों का ध्यान आकर्षित होता है।

3. UltraPixel: उच्च रिज़ॉल्यूशन छवि उत्पन्न करने की क्रांति

UltraPixel एक ऐसी तकनीक है जो उच्च रिज़ॉल्यूशन छवियों को उत्पन्न कर सकती है, जो डिज़ाइनरों और रचनाकारों के लिए एक वरदान है। Stable cascade प्रशिक्षण और माइक्रो-ट्यूनिंग के माध्यम से, यह सीधे 1K से 6K रिज़ॉल्यूशन की छवियाँ उत्पन्न करने का समर्थन करता है। इसकी तकनीक में इंप्लिसिट न्यूरल रिप्रेजेंटेशन और स्केल-सेन्सिटिव नॉर्मलाइजेशन लेयर शामिल हैं, जो उच्च स्तर के विवरण और यथार्थता को बनाए रखते हैं। साथ ही, यह न्यूनतम स्थान में कुशलता से काम करता है, पैरामीटर उपयोगिता 97% तक है, प्रशिक्षण और अनुमान की दक्षता को बढ़ाता है।

QQ截图20240709110659.jpg

【AiBase सारांश:】

🔍 UltraPixel सीधे 1K से 6K रिज़ॉल्यूशन की छवियाँ उत्पन्न करने का समर्थन करता है, विवरण इतनी बारीकी से कि छिद्र भी स्पष्ट हैं।

🚀 Stable cascade प्रशिक्षण और माइक्रो-ट्यूनिंग पर आधारित, इसे ओपन-सोर्स किया जाएगा, ताकि अधिक लोग इस तकनीक का अनुभव कर सकें।

💡 कम रिज़ॉल्यूशन छवियों में समृद्ध अर्थ जानकारी का उपयोग करके उच्च रिज़ॉल्यूशन छवियों को उत्पन्न करने का मार्गदर्शन करता है, जटिलता को कम करता है, और उच्च स्तर के विवरण और यथार्थता को बनाए रखता है।

विवरण लिंक: https://top.aibase.com/tool/ultrapixel

4. Groq ने लाइटनिंग-फास्ट LLM इंजन लॉन्च किया, चार महीनों में 280,000 डेवलपर्स को आकर्षित किया

Groq कंपनी ने हाल ही में एक लाइटनिंग-फास्ट LLM इंजन लॉन्च किया है, जिसने व्यापक ध्यान आकर्षित किया है। यह इंजन प्रति सेकंड 1256.54 टैग्स को प्रोसेस करता है, जो GPU की गति से बहुत अधिक है, LLM चैट बॉट्स की गति और लचीलापन प्रदर्शित करता है। Groq मुफ्त LLM वर्कलोड सेवा प्रदान करता है, जिसमें 280,000 से अधिक डेवलपर्स ने भाग लिया है। CEO रॉस का अनुमान है कि अगले वर्ष, वैश्विक आधे अनुमानित गणना Groq के चिप्स पर चलेगी।

image.png

【AiBase सारांश:】

🚀 Groq का LLM इंजन प्रति सेकंड 1256.54 टैग्स प्रोसेस करता है, जो GPU की गति से बहुत अधिक है।

🤖 Groq का इंजन LLM चैट बॉट्स की गति और लचीलापन प्रदर्शित करता है, डेवलपर्स और गैर-डेवलपर्स का ध्यान आकर्षित करता है।

💻 Groq मुफ्त LLM वर्कलोड सेवा प्रदान करता है, जिसमें 280,000 से अधिक डेवलपर्स ने भाग लिया है, और अनुमान है कि वैश्विक आधे अनुमानित गणना इसके चिप्स पर चलेगी।

5. ड्रोन टीम ने फिल्म-स्तरीय दृश्य AI विशेष प्रभाव Odyssey लॉन्च किया

ड्रोन टीम ने हॉलीवुड में कदम रखा है, और फिल्म-स्तरीय दृश्य AI विशेष प्रभाव Odyssey का अनावरण किया है, जो फिल्म, टीवी शो और वीडियो गेम बनाने के तरीके को बदलता है। Odyssey हॉलीवुड स्तर की कहानी दृश्य उत्पन्न कर सकता है, वीडियो AI बाधाओं को पार कर सकता है, और दृश्य कथा के核心 को पूरी तरह से नियंत्रित कर सकता है। यह पिक्सर से प्रेरित है, और इसका लक्ष्य AI के माध्यम से फिल्म और टीवी सामग्री का निर्माण करना है, AI नियंत्रण की चुनौतियों को हल करना है।

【AiBase सारांश:】

🎬 Odyssey दृश्य कथा के核心 को पूरी तरह से नियंत्रित करता है, उच्च गुणवत्ता वाले दृश्य तत्वों और पहलुओं को उत्पन्न करता है।

🌟 एक मजबूत जनरेशन मॉडल का प्रस्ताव करता है, चार मॉडलों को प्रशिक्षित करता है ताकि दृश्य विवरण को ठीक से कॉन्फ़िगर किया जा सके।

🚗 टीम का संबंध ऑटोनॉमस कारों से है, संस्थापक के पास ऑटोनॉमस ड्राइविंग क्षेत्र में समृद्ध अनुभव है।

विवरण लिंक: https://top.aibase.com/tool/odyssey

6. रिपोर्ट्स के अनुसार OpenAI का आंतरिक फोरम हैक किया गया, गोपनीयता चोरी हुई

हाल ही में, प्रसिद्ध आर्टिफिशियल इंटेलिजेंस कंपनी OpenAI का आंतरिक फोरम हैकर्स द्वारा हमले का शिकार हुआ, जिससे सुरक्षा मुद्दों का सामना करना पड़ा। कर्मचारियों को सुरक्षा खामियों के संभावित दुरुपयोग की चिंता है। कंपनी ने डेटा सुरक्षा बढ़ाने के लिए चैट रिकॉर्ड को एन्क्रिप्ट करने के लिए अपडेट जारी किया है, और सुरक्षा उपायों को मजबूत करने के लिए सुरक्षा और सुरक्षा समिति का गठन किया है। AI द्वारा लाए गए चुनौतियों का वैश्विक सहयोग करना विशेष रूप से महत्वपूर्ण हो गया है।

【AiBase सारांश:】

💡 OpenAI का आंतरिक फोरम हैक किया गया, कंपनी की सुरक्षा पर सवाल उठाया गया, और कर्मचारियों को सुरक्षा खामियों के संभावित दुरुपयोग की चिंता है।

💡 ChatGPT macOS एप्लिकेशन में सुरक्षा खामियों की पहचान की गई, कंपनी ने डेटा सुरक्षा बढ़ाने के लिए चैट रिकॉर्ड को एन्क्रिप्ट करने के लिए अपडेट जारी किया।

💡 OpenAI ने रूस और इजरायल से कई गुप्त प्रभावी अभियानों को सफलतापूर्वक रोका, और सुरक्षा उपायों को मजबूत करने के लिए सुरक्षा और सुरक्षा समिति का गठन किया।

7. मेटा AI ने मोबाइल उपकरणों के लिए कॉम्पैक्ट भाषा मॉडल MobileLLM विकसित किया

मेटा AI शोध टीम ने MobileLLM का अनावरण किया है, जो स्मार्टफोन्स और अन्य संसाधन-सीमित उपकरणों के लिए एक कुशल भाषा मॉडल डिज़ाइन करने का एक नया तरीका है। यह शोध प्रभावी AI मॉडल के आकार के बारे में धारणाओं को चुनौती देता है, 2.7% से 4.3% तक प्रदर्शन में सुधार प्राप्त करता है। MobileLLM का विकास अधिक कुशल AI मॉडल की आवश्यकता को पूरा करता है, अभी तक जनता के लिए उपलब्ध नहीं है, लेकिन प्री-ट्रेंड कोड ओपन-सोर्स किया गया है।

image.png

【AiBase सारांश:】

🔑 MobileLLM संसाधन-सीमित उपकरणों के लिए डिज़ाइन किया गया एक कुशल भाषा मॉडल है, जो बड़े मॉडल की आवश्यकता को चुनौती देता है।

🚀 MobileLLM का नवाचार मॉडल गहराई को प्राथमिकता देता है, एम्बेडिंग साझा करने और समूह प्रश्न ध्यान का उपयोग करता है, और सीधे ब्लॉक वजन साझा करने की तकनीक अपनाता है।

💡 MobileLLM बेंचमार्क परीक्षण कार्यों पर उत्कृष्ट प्रदर्शन करता है, 3.5 करोड़ पैरामीटर संस्करण कुछ कार्यों पर 70 करोड़ पैरामीटर मॉडल के बराबर है।

8. Poe सोशल प्लेटफॉर्म ने Previews सुविधा लॉन्च की

Poe सोशल प्लेटफॉर्म ने "Previews" नामक नवाचार सुविधा लॉन्च की है, जो उपयोगकर्ताओं को अभूतपूर्व इंटरैक्टिव अनुभव प्रदान करती है, और AI सामाजिक इंटरैक्शन के एक नए युग की शुरुआत करती है। Previews सुविधा सहज और उपयोग में आसान है, जिससे उपयोगकर्ता चैट इंटरफेस में AI द्वारा उत्पन्न वेब अनुप्रयोगों को वास्तविक समय में देख सकते हैं और तात्कालिक इंटरैक्शन कर सकते हैं, जिससे AI के साथ उपयोगकर्ता के इंटरैक्शन की गुणवत्ता बढ़ जाती है।

image.png

【AiBase सारांश:】

🚀 AI सामाजिक इंटरैक्शन का नया युग, Previews सुविधा उपयोगकर्ताओं को AI द्वारा उत्पन्न वेब अनुप्रयोगों को सहजता से संचालित करने की अनुमति देती है।

💡 Previews सुविधा उपयोग में आसान और सहज है, जिससे उपयोगकर्ता AI के साथ तात्कालिक इंटरैक्शन कर सकते हैं।

💻 बड़े भाषा मॉडल के लिए उपयुक्त, यह सामान्य उपयोगकर्ताओं को उच्च स्तरीय AI प्रोग्रामिंग अनुप्रयोगों से परिचित कराने का अवसर प्रदान करता है, और Poe प्लेटफॉर्म की आकर्षण बढ़ाता है।

9. Xinsir ने Controlnet++ मॉडल ओपन-सोर्स किया, Openpose, Canny आदि दस से अधिक नियंत्रणों का समर्थन करता है

Xinsir ने हाल ही में Controlnet++ ओपन-सोर्स मॉडल जारी किया है, जिसमें कई नियंत्रण स्थितियाँ हैं, जो उच्च गुणवत्ता की छवियाँ उत्पन्न कर सकती हैं, विशेष रूप से उन डिज़ाइनरों के लिए जो बारीकी से संपादन की आवश्यकता रखते हैं। यह मॉडल ControlNet आर्किटेक्चर पर आधारित है, और दस से अधिक विभिन्न नियंत्रण प्रकारों का समर्थन करने के लिए नए मॉड्यूल को जोड़ा गया है, जो विभिन्न नियंत्रण स्थितियों के तहत छवि उत्पन्न करने के उदाहरण प्रदान करता है। हालांकि वर्तमान में इसे वेब UI और Comfyui पर उपयोग नहीं किया जा सकता है, इसकी बहुपरकारी और उच्च गुणवत्ता की आउटपुट इसे टेक्स्ट से इमेज उत्पन्न करने के क्षेत्र में एक महत्वपूर्ण प्रगति बनाती है।

image.png

【AiBase सारांश:】

🔧 Controlnet++ Openpose और Canny जैसे इनपुट का समर्थन करता है, जिससे मॉडल को बार-बार बदलने से बचा जा सके।

🧩 मॉडल डिजाइन की विशेषताएँ विभिन्न नियंत्रण प्रदान करती हैं, एक ही नेटवर्क पैरामीटर का उपयोग करके विभिन्न स्थितियों में छवि उत्पन्न करना।

🚀 Controlnet++ SDXL प्रयोगों में उत्कृष्ट प्रदर्शन करता है, विभिन्न नियंत्रण स्थितियों के तहत छवि उत्पन्न करने के उदाहरण प्रदान करता है।

विवरण लिंक: https://top.aibase.com/tool/controlnet-

10. अलीपे का मेडिकल बड़े मॉडल ने GPT-4 स्तर को पार किया

अलीपे का मेडिकल बड़े मॉडल मध्य और अंग्रेजी परीक्षा में GPT-4 को पार कर गया है, और यह जिआंगजु, झेजियांग और शंघाई के प्रमुख अस्पतालों में लागू किया गया है। इस मॉडल में मल्टी-मोडल क्षमताएँ हैं, सटीकता 90% से अधिक है, और यह स्मार्ट प्रश्नोत्तर, मेडिकल रिकॉर्ड संरचना और खोज जैसी सेवाएँ प्रदान कर सकता है। अलीपे ने कई संस्थाओं के साथ मिलकर AI मेडिकल निर्माण योजना शुरू की है, जिसका उद्देश्य चिकित्सा दक्षता और डेटा सुरक्षा को बढ़ाना है।

【AiBase सारांश:】

🏥 अलीपे का मेडिकल बड़े मॉडल मध्य और अंग्रेजी परीक्षा में GPT-4 स्तर को पार कर गया है, और यह प्रमुख अस्पतालों में लागू किया गया है।

💡 इस मॉडल में मल्टी-मोडल क्षमताएँ हैं, सटीकता 90% से अधिक है, और यह स्मार्ट प्रश्नोत्तर, मेडिकल रिकॉर्ड संरचना और खोज जैसी सेवाएँ प्रदान कर सकता है।