【AI日报】栏目 में आपका स्वागत है! यह आपके लिए हर दिन人工智能 की दुनिया की खोज करने का मार्गदर्शक है, हर दिन हम आपको AI क्षेत्र की प्रमुख सामग्री प्रदान करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, ताकि आप तकनीकी प्रवृत्तियों को समझ सकें और नवाचार AI उत्पादों के अनुप्रयोगों को जान सकें।

ताजा AI उत्पादजानने के लिए क्लिक करेंhttps://top.aibase.com/

1、अलीबाबा का डबिंग प्रोजेक्ट EMO प्रारंभिक परीक्षण में है, तस्वीरों को गाने वाले वीडियो में बदल सकता है

अलीबाबा द्वारा पेश किया गया डबिंग प्रोजेक्ट EMO प्रारंभिक परीक्षण में है, उपयोगकर्ता को केवल एक तस्वीर और आवाज मॉडल प्रदान करना होगा ताकि डिजिटल इमेज को अनुकूलित किया जा सके, जिससे कम लागत और उच्च दक्षता के साथ डिजिटल व्यक्ति का अनुभव प्राप्त किया जा सके। EMO मॉडल की विशेषताएँ सरल संचालन, कम लागत, व्यापक अनुप्रयोग और स्वाभाविक अभिव्यक्ति हैं, जो उपयोगकर्ताओं को एक नया डिजिटल व्यक्ति अनुभव प्रदान करती हैं।

image.png

【AiBase सारांश:】

🎤 सरल संचालन: उपयोगकर्ता को केवल एक तस्वीर और आवाज मॉडल प्रदान करना होगा ताकि डिजिटल इमेज को अनुकूलित किया जा सके।

💰 कम लागत: EMO मॉडल एक मुफ्त और प्रभावी समाधान प्रदान करता है, अन्य उत्पादों की तुलना में लागत कम है।

🎨 व्यापक अनुप्रयोग: केवल यथार्थवादी चित्रों तक सीमित नहीं, बल्कि 3D मॉडल और एनिमेशन स्टाइल वीडियो भी उत्पन्न कर सकता है, विभिन्न उपयोगकर्ताओं की आवश्यकताओं को पूरा करता है।

प्रारंभिक परीक्षण के लिए आवेदन करने का लिंक: https://www.wjx.top/vm/exOVbr1.aspx#

2、एप्पल ने OpenELM छोटे AI मॉडल का अनावरण किया

एप्पल ने OpenELM का अनावरण किया, जो छोटे AI मॉडल की एक श्रृंखला है, जो कंपनी की स्थानीय AI संचालन क्षेत्र में महत्वपूर्ण प्रगति का प्रतीक है। ये छोटे मॉडल अधिकांश हल्के AI मॉडलों की तुलना में छोटे हैं और मोबाइल फोन और लैपटॉप जैसे उपकरणों पर चलने के लिए उपयुक्त हैं। एप्पल ने संकेत दिया कि AI को iPhone जैसे उपकरणों में लाने की योजना है, जिससे कंपनी की AI क्षेत्र में महत्वाकांक्षा प्रदर्शित होती है।

image.png

【AiBase सारांश:】

⭐ OpenELM एक बहुत छोटे भाषा मॉडल की श्रृंखला है, जो टेक्स्ट संबंधित कार्यों पर प्रभावी प्रदर्शन करता है।

⭐ OpenELM अधिकांश हल्के AI मॉडलों की तुलना में छोटा है, विभिन्न विनिर्देशों में विभाजित है, और विभिन्न उपकरणों पर चलने के लिए उपयुक्त है।

⭐ एप्पल ने संकेत दिया कि AI सुविधाएँ कंपनी के उपकरणों में आएंगी, कंपनी ने कई AI मॉडल जारी किए हैं, जो AI क्षेत्र में निवेश को दर्शाते हैं।

विवरण लिंक:https://top.aibase.com/tool/openelm

3、Open-Sora ने चुपचाप अपडेट किया, 16 सेकंड के वीडियो निर्माण और 720p रिज़ॉल्यूशन का समर्थन करता है

Open-Sora प्रोजेक्ट ने ओपन-सोर्स समुदाय में चुपचाप अपडेट किया है, जो 16 सेकंड तक के एकल-शॉट वीडियो निर्माण और 720p रिज़ॉल्यूशन का समर्थन करता है, विभिन्न वीडियो निर्माण आवश्यकताओं के समाधान प्रदान करता है। तकनीकी रिपोर्ट ने नए कार्य और मॉडल आर्किटेक्चर का विस्तार से विवरण दिया है, STDiT आर्किटेक्चर में महत्वपूर्ण सुधार किए गए हैं, जिससे प्रशिक्षण स्थिरता और प्रदर्शन में सुधार हुआ है। प्रोजेक्ट ने बहु-चरण प्रशिक्षण विधियों और एकीकृत ग्राफ़-से-वीडियो/वीडियो-से-वीडियो ढांचे में महत्वपूर्ण प्रगति की है।

image.png

【AiBase सारांश:】

🚀 Open-Sora ने 16 सेकंड के वीडियो निर्माण और 720p रिज़ॉल्यूशन का समर्थन किया, विभिन्न वीडियो निर्माण आवश्यकताओं को पूरा किया।

🔬 तकनीकी रिपोर्ट ने नए कार्य और मॉडल आर्किटेक्चर का विस्तार से विवरण दिया, STDiT आर्किटेक्चर में सुधार किया, जिससे प्रशिक्षण स्थिरता और प्रदर्शन में सुधार हुआ।

💡 प्रोजेक्ट ने बहु-चरण प्रशिक्षण विधियों और एकीकृत ग्राफ़-से-वीडियो/वीडियो-से-वीडियो ढांचे का उपयोग किया, उच्च गुणवत्ता वाले वीडियो निर्माण की सुविधा प्रदान की।

विवरण लिंक:https://top.aibase.com/tool/open-sora

4、Gemini Pro1.5 से अधिक शक्तिशाली! वीडियो को समझने वाले मल्टीमॉडल Pegasus-1 का सार्वजनिक परीक्षण

Pegasus-1 वीडियो भाषा आधार मॉडल का उन्नत संस्करण है, जो कई कार्यों में उल्लेखनीय उपलब्धियाँ हासिल करता है, वीडियो समझने के मानकों को फिर से स्थापित करता है। इस मॉडल में लगभग 1.7 अरब पैरामीटर हैं, जो डेटा ऑप्टिमाइजेशन, वीडियो प्रोसेसिंग और प्रशिक्षण तकनीकों में सुधार के माध्यम से उत्कृष्ट वीडियो समझ और टेक्स्ट जनरेशन क्षमताएँ प्रदान करता है।

image.png

【AiBase सारांश:】

🌟 Pegasus-1 वीडियो समझने के क्षेत्र में नए突破 प्राप्त करता है, Gemini Pro1.5 से अधिक शक्तिशाली है, उत्कृष्ट प्रदर्शन करता है।

🌟 उत्पाद की विशेषताओं में डेटा ऑप्टिमाइजेशन, वीडियो प्रोसेसिंग में सुधार और प्रशिक्षण तकनीकों में सुधार शामिल हैं, जो मॉडल प्रदर्शन के लिए मजबूत आधार प्रदान करते हैं।

🌟 बेंचमार्क परीक्षणों में, Pegasus-1 ने Google Gemini Pro जैसे मौजूदा मॉडलों को पीछे छोड़ दिया, वीडियो प्रश्न-उत्तर, संवाद और सारांश जैसे कार्यों में उत्कृष्ट प्रदर्शन दिखाया।

विवरण लिंक:https://top.aibase.com/tool/pegasus-1API

5、WeChat ने डेस्कटॉप कार्यकुशलता AI टूल Xiao Wei Assistant जारी किया

WeChat ने हाल ही में "Xiao Wei Assistant" नामक एक डेस्कटॉप AI कार्यकुशलता टूल जारी किया है, जो प्राकृतिक भाषा प्रोसेसिंग तकनीक के माध्यम से उपयोगकर्ता की कार्यकुशलता को बढ़ाता है। यह टूल Windows और Mac ऑपरेटिंग सिस्टम का समर्थन करता है, जिसमें लचीला खोज कार्य, अंतर्निहित उपयोगी उपकरण और उंगलियों का सहायक कार्य, साथ ही समूह कार्य और समर्थन संवाद सेवाएँ शामिल हैं।

image.png

【AiBase सारांश:】

🔍 Xiao Wei Assistant लचीला खोज कार्य प्रदान करता है, जो प्राकृतिक भाषा में कंप्यूटर में निर्दिष्ट फ़ोल्डर की सामग्री को खोजने का समर्थन करता है।

🛠️ अंतर्निहित उपयोगी उपकरणों में WeChat अनुवाद, क्लिपबोर्ड प्रबंधन, JSON मैजिक क्यूब और फास्ट थॉट कैप्सूल शामिल हैं, जो दैनिक सहायक कार्यों को बढ़ाते हैं।

🤖 उंगलियों का सहायक कार्य उपयोगकर्ताओं को पूर्वनिर्धारित त्वरित कार्यों जैसे कि टेक्स्ट अनुवाद और टेक्स्ट संग्रहण तक तेजी से पहुंचने की अनुमति देता है, जो कार्यों को अनुकूलित करने का समर्थन करता है।

विवरण लिंक:https://top.aibase.com/tool/xiaoweizhushou

नोट: वर्तमान में WeChat ने आधिकारिक वेबसाइट पर डाउनलोड लिंक बंद कर दिया है (विशिष्ट कारण अज्ञात है)

6、अत्यधिक वास्तविकता वाला वर्चुअल ट्राई-ऑन सॉफ़्टवेयर IDM-VTON, कपड़ों की तहें भी इतनी वास्तविक हैं

IDM-VTON वर्चुअल ट्राई-ऑन तकनीक ने व्यापक ध्यान आकर्षित किया है, विवरण प्रबंधन बारीक है, उपयोगकर्ता कपड़ों की गुणवत्ता और डिजाइन का वास्तविक अनुभव कर सकते हैं। तकनीक की उच्च वास्तविकता, जटिल पृष्ठभूमि प्रबंधन, स्थिरता बनाए रखना, बनावट और पैटर्न को सटीक रूप से पुनः प्रस्तुत करना। इसका उपयोग फैशन रिटेल, व्यक्तिगत डिजाइन, ऑनलाइन ट्राई-ऑन जैसे क्षेत्रों में किया जाता है, जो उपभोक्ताओं को सुविधाजनक ट्राई-ऑन विधि प्रदान करता है, और डिजाइनरों और रिटेलर्स को नए प्रदर्शन बिक्री के तरीकों का अवसर देता है।

image.png

【AiBase सारांश:】

👗 तकनीक की उच्च वास्तविकता, विवरण बारीक, वास्तविकता के करीब ट्राई-ऑन अनुभव प्रदान करती है।

🌟 जटिल पृष्ठभूमि प्रबंधन, ट्राई-ऑन प्रभाव की उच्च गुणवत्ता बनाए रखती है, विभिन्न परिदृश्यों के लिए उपयुक्त है।

🔄 स्थिरता बनाए रखना, समान कपड़ों के विभिन्न आकारों में प्रभाव को समान रूप से प्रदर्शित करना, बनावट और पैटर्न को सटीक रूप से पुनः प्रस्तुत करना।

प्रोजेक्ट का पता:https://idm-vton.github.io/

ट्रायल का पता:https://top.aibase.com/tool/idm-vton

7、AI सर्च इंजन Perplexity.ai की मूल्यांकन 1 अरब डॉलर तक पहुंच गई और नए व्यावसायिक उत्पाद जारी किए

Perplexity.ai ने हाल ही में वित्त पोषण पूरा किया, जिसका मूल्यांकन अरबों डॉलर तक पहुंच गया है, और "Enterprise Pro" नामक व्यावसायिक सेवा को लॉन्च किया, जो कार्यस्थल खोज की सटीकता और दक्षता में सुधार करता है। कंपनी वैश्विक विस्तार को तेजी से बढ़ाने की योजना बना रही है, SoftBank Corp. और Deutsche Telekom के साथ मिलकर AI क्षमताओं को बढ़ावा देने के लिए।

image.png

【AiBase सारांश:】

⭐ वित्त पोषण पूरा किया, 1 अरब डॉलर तक का मूल्यांकन, "Enterprise Pro" लॉन्च किया, जो खोज की सटीकता और दक्षता में सुधार करता है।

⭐ SoftBank Corp. और Deutsche Telekom के साथ मिलकर AI क्षमताओं को बढ़ावा देने के लिए वैश्विक विस्तार को तेज करना।

⭐ डेटा गोपनीयता को बढ़ाना, सुरक्षा में सुधार, उपयोगकर्ता प्रबंधन, SOC2 प्रमाणन, डेटा संग्रहण और सिंगल साइन-ऑन जैसी सुविधाएँ प्रदान करना।

विवरण लिंक:https://top.aibase.com/tool/perplexity-enterprise-pro

8、SenseTime ने HiDiffusion जारी किया, SD निर्माण की गति तेज, चित्र गुणवत्ता उच्च

SenseTime द्वारा हाल ही में जारी HiDiffusion तकनीक ने उद्योग में व्यापक ध्यान आकर्षित किया है। यह तकनीक SD द्वारा उत्पन्न छवियों के रिज़ॉल्यूशन और निर्माण की गति में उल्लेखनीय वृद्धि कर सकती है, जिससे छवि रिज़ॉल्यूशन 4096×4096 तक हो सकता है, साथ ही निर्माण की गति 1.5 से 6 गुना बढ़ सकती है। HiDiffusion ने वस्तुओं की पुनरावृत्ति और उच्च गणना के बोझ की समस्याओं को हल किया है, और उच्च रिज़ॉल्यूशन छवि निर्माण कार्यों में उत्कृष्ट परिणाम प्राप्त किया है।

image.png

【AiBase सारांश:】

🚀 HiDiffusion तकनीक SD द्वारा उत्पन्न छवियों के रिज़ॉल्यूशन और गति में सुधार करती है।

🔍 HiDiffusion ढांचे में RAU-Net मॉड्यूल और MSW-MSA ध्यान तंत्र शामिल हैं।

💡 HiDiffusion का उपयोग करके छवि निर्माण का रिज़ॉल्यूशन 4096×4096 तक बढ़ाया जा सकता है, गति 1.5 से 6 गुना बढ़ाई जा सकती है।

विवरण लिंक:https://top.aibase.com/tool/hidiffusion

9、《यह है ChatGPT》微信读书热搜榜第一名

यह लेख Stephen Wolfram द्वारा 2023 में प्रकाशित "यह है ChatGPT" पुस्तक का परिचय देता है, जो OpenAI द्वारा विकसित AI चैटबॉट कार्यक्रम ChatGPT का गहन विश्लेषण करता है, यह दिखाता है कि यह व्यापक ध्यान क्यों आकर्षित करता है और Wolfram|Alpha के साथ इसका उपयोग कैसे किया जा सकता है।

【AiBase सारांश:】

🤖 ChatGPT OpenAI द्वारा विकसित एक चैटबॉट कार्यक्रम है, जो 2022 में जारी किया गया था।

📚 "यह है ChatGPT" ने ChatGPT के आंतरिक तंत्र और सिद्धांतों का विश्लेषण किया है, साथ ही यह कैसे अर्थपूर्ण पाठ उत्पन्न करता है।

💡 ChatGPT ने Wolfram|Alpha के साथ मिलकर अपनी गणना ज्ञान की सुपरपावर प्रदर्शित की है।

10、AI फिल्म निर्माण प्लेटफार्म Morph Studio ने आधिकारिक तौर पर प्रतीक्षा सूची में उपयोगकर्ताओं के लिए पहुंच खोली

Morph Studio ने आधिकारिक तौर पर प्रतीक्षा सूची में उपयोगकर्ताओं के लिए पहुंच खोली, जिसने व्यापक ध्यान आकर्षित किया। प्लेटफ़ॉर्म ने वीडियो निर्माण के पात्रों की स्थिरता और डबिंग निर्माण कार्यक्षमता को जोड़ा है, जिससे उपयोगकर्ता अनुभव में सुधार हुआ है। उपयोगकर्ता संदर्भ छवियों के माध्यम से वीडियो को बारीकी से बना सकते हैं, ध्वनि प्रभाव मॉडल का उपयोग करके ऑडियो प्रभाव को समृद्ध कर सकते हैं। Morph Studio ने Stability AI के साथ मिलकर एक नया फिल्म निर्माण तरीका पेश किया है, जो एकीकृत प्रक्रिया को प्रभावी और संगठित बनाता है। सक्रिय उपयोगकर्ता समुदाय एक प्रतिस्पर्धात्मक लाभ है, जो प्लेटफ़ॉर्म के विकास को गति देता है।

image.png

【AiBase सारांश:】

🎥 वीडियो निर्माण के पात्रों की स्थिरता और डबिंग निर्माण कार्यक्षमता उपयोगकर्ता अनुभव में सुधार करती है।

🖼️ संदर्भ छवियों के माध्यम से बारीकी से वीडियो बनाना, ध्वनि प्रभाव मॉडल ऑडियो प्रभाव को समृद्ध करता है।

🚀 Stability AI के साथ मिलकर एकीकृत प्रक्रिया प्रभावी और संगठित है।

उत्पाद का पता:https://top.aibase.com/tool/morph-studio

यहाँ प्रतीक्षा सूची में शामिल होने के लिए क्लिक करें:https://app.morphstudio.com/waitlist