आपका स्वागत है 【AI दैनिक】 खंड में! यहाँ हर दिन कृत्रिम बुद्धिमत्ता की दुनिया का अन्वेषण करने के लिए आपका मार्गदर्शक है, हर दिन हम आपको AI क्षेत्र की गर्म विषयों को प्रस्तुत करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, ताकि आप तकनीकी प्रवृत्तियों को समझ सकें और नवोन्मेषी AI उत्पादों के अनुप्रयोगों को जान सकें।
नए AI उत्पादों के लिए जानकारी के लिए क्लिक करें: https://top.aibase.com/
1. AI वीडियो के बादशाह की वापसी! Runway का नया Gen3 मॉडल ने फिर से नेटिज़न्स को चौंका दिया
यह लेख Runway द्वारा हाल ही में लॉन्च किए गए नए वीडियो जनरेशन मॉडल Gen-3Alpha के बारे में है, जिसने विश्वसनीयता, सुसंगतता और क्रियाविधि प्रदर्शन में महत्वपूर्ण सुधार किया है, जो सामान्य विश्व मॉडल बनाने की दिशा में एक महत्वपूर्ण कदम है। Gen-3Alpha में कई उल्लेखनीय विशेषताएँ हैं और यह रचनात्मक उद्योग में एक नया सितारा बन गया है।
【AiBase सारांश:】
⭐️ Gen-3Alpha ने विश्वसनीयता, सुसंगतता और क्रियाविधि प्रदर्शन में महत्वपूर्ण वृद्धि की है, यह विविध भावनाओं वाले, वास्तविक मानव पात्रों का निर्माण कर सकता है।
⭐️ Gen-3Alpha विभिन्न जनरेशन उपकरणों का समर्थन करता है, जैसे कि टेक्स्ट-टू-वीडियो, इमेज-टू-वीडियो, टेक्स्ट-टू-इमेज कनवर्ज़न टूल।
⭐️ यह समय के सटीक नियंत्रण की अनुमति देता है, जिसमें कई उन्नत नियंत्रण मोड शामिल हैं, जैसे कि मूवमेंट ब्रश, उन्नत कैमरा नियंत्रण और डायरेक्टर मोड।
⭐️ अत्यधिक स्थिर प्रकाश और छाया, यहां तक कि उच्च गति वाले दृश्यों में भी उच्च गुणवत्ता का आउटपुट बनाए रखता है।
अधिक वीडियो देखने के लिए यहां क्लिक करें: https://mp.weixin.qq.com/s/5LbM0NfkeiYFU0r4VDqpYA
वेबसाइट: https://top.aibase.com/tool/gen-3-alpha
2. Luma AI ने Extend फीचर लॉन्च किया, वीडियो की लंबाई 10 सेकंड से अधिक बढ़ाई
Luma AI ने हाल ही में Dream Machine वीडियो मॉडल को अपडेट किया है, जिसमें Extend फीचर जोड़ा गया है, जिससे वीडियो की लंबाई 10 सेकंड से अधिक बढ़ाई जा सकती है, जबकि मूल वीडियो की शैली और पात्र की एकरूपता बनाए रखी जा सकती है। हालांकि Extend फीचर द्वारा उत्पन्न विस्तारित वीडियो में अधिक समय लगता है, लेकिन शैली की एकरूपता अच्छी तरह से बनाए रखी गई है।
【AiBase सारांश:】
✨ Dream Machine ने Extend फीचर को अपग्रेड किया, वीडियो की लंबाई 10 सेकंड से अधिक हो सकती है, मूल वीडियो की शैली और पात्र की एकरूपता बनाए रखी गई।
⏱️ Extend फीचर का उपयोग करके वीडियो बढ़ाने में अधिक समय लगता है, लेकिन शैली की एकरूपता अच्छी है।
🔗 विवरण: https://www.chinaz.com/ainews/9639.shtml
3. DeepSeek ने ओपन-सोर्स मॉडल DeepSeek-Coder-V2 जारी किया
DeepSeek ने हाल ही में ओपन-सोर्स मॉडल DeepSeek-Coder-V2 जारी किया है, जो कोड और गणितीय क्षमताओं में GPT-4-Turbo को पार कर गया है, और यह विश्व स्तर पर अग्रणी प्रदर्शन करता है। यह मॉडल MoE आर्किटेक्चर का उपयोग करता है, जो कई भाषाओं और लंबे संदर्भ प्रसंस्करण लंबाई का समर्थन करता है। उपयोगकर्ता इसे व्यावसायिक रूप से मुफ्त में उपयोग कर सकते हैं, बिना किसी आवेदन के।
【AiBase सारांश:】
🚀 मॉडल का प्रदर्शन विश्व स्तर पर अग्रणी है, विशेष रूप से कोड निर्माण और गणितीय गणना में।
💡 यह 338 प्रोग्रामिंग भाषाओं और 128K संदर्भ लंबाई का समर्थन करता है, अधिक विकास आवश्यकताओं को पूरा करता है।
🔗 API सेवा प्रदान करता है, जिसकी कीमत DeepSeek-V2 के समान है, और यह बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन करता है।
विवरण लिंक: https://top.aibase.com/tool/deepseek-coder-v2
4. Adobe Acrobat में महत्वपूर्ण AI अपग्रेड, कई दस्तावेज़ों का विश्लेषण और चित्र निर्माण का समर्थन
Adobe एक नई AI अपग्रेड श्रृंखला लॉन्च करने जा रहा है, जो Acrobat के AI सहायक कार्यों और चित्र निर्माण क्षमताओं को बढ़ाता है, डेटा गोपनीयता की सुरक्षा सुनिश्चित करता है। यह अपडेट कार्यालय की उत्पादकता को काफी बढ़ा देगा, बड़े पैमाने पर दस्तावेज़ों को संभालने और दृश्य सामग्री को अनुकूलित करने में मदद करेगा।
【AiBase सारांश:】
🚀 AI सहायक कार्यों का अपग्रेड, कई दस्तावेज़ों का विश्लेषण और पूछताछ का समर्थन, उपयोगकर्ता अनुभव को बढ़ाता है।
🖼️ नया AI चित्र निर्माणकर्ता, उपयोगकर्ता नए चित्र बना सकते हैं या मौजूदा PDF में चित्र संपादित कर सकते हैं।
🔒 डेटा गोपनीयता सुरक्षा का वादा, दस्तावेज़ों को क्लाउड पर विश्लेषण के लिए अपलोड किया जाता है लेकिन AI मॉडल के प्रशिक्षण के लिए उपयोग नहीं किया जाता है, तीसरे पक्ष के उपयोग पर रोक है।
5. Apple ने Hugging Face प्लेटफ़ॉर्म पर 20 Core ML मॉडल जारी किए
Apple ने Hugging Face प्लेटफ़ॉर्म पर 20 नए Core ML मॉडल और 4 डेटा सेट जारी किए हैं, जो AI विकास को बढ़ावा देने में इसके महत्वपूर्ण प्रगति को प्रदर्शित करते हैं। इस अपडेट में टेक्स्ट और चित्र पर ध्यान केंद्रित करने वाले नए मॉडल के साथ-साथ चित्र वर्गीकरण, मोनो डीप्थ अनुमान और सेमांटिक सेगमेंटेशन जैसे व्यापक अनुप्रयोग शामिल हैं। Apple ने उपकरण AI के महत्व को रेखांकित किया है, उपयोगकर्ता उपकरणों पर ऑप्टिमाइज्ड मॉडल को चलाकर अनुप्रयोगों के प्रदर्शन को बढ़ाता है, जबकि उपयोगकर्ता डेटा की सुरक्षा और गोपनीयता को भी सुनिश्चित करता है।
【AiBase सारांश:】
🚀 Apple ने Hugging Face प्लेटफ़ॉर्म पर 20 नए Core ML मॉडल और 4 डेटा सेट जारी किए, AI विकास को बढ़ावा दिया।
💡 नए जारी किए गए Core ML मॉडल में चित्र वर्गीकरण, मोनो डीप्थ अनुमान और सेमांटिक सेगमेंटेशन जैसे व्यापक अनुप्रयोग शामिल हैं।
🔒 Apple ने उपकरण AI के महत्व को रेखांकित किया है, ऑप्टिमाइज्ड मॉडल उपयोगकर्ता उपकरणों पर चलाते हैं, अनुप्रयोगों के प्रदर्शन को बढ़ाते हैं और उपयोगकर्ता डेटा की सुरक्षा और गोपनीयता को सुनिश्चित करते हैं।
विवरण लिंक: https://huggingface.co/apple
6. ElevenLabs ने ओपन-सोर्स वीडियो जनरेशन ऑडियो प्रभाव उपकरण लॉन्च किया, वीडियो अपलोड करते ही ऑटो डबिंग
ElevenLabs एक कंपनी है जो ऑडियो जनरेशन तकनीक पर ध्यान केंद्रित करती है, हाल ही में वीडियो जनरेशन क्षेत्र में कदम रखा है, और एक प्रोजेक्ट को ओपन-सोर्स किया है जो अपलोड किए गए वीडियो के लिए ऑटो डबिंग करता है, उपयुक्त ऑडियो प्रभाव उत्पन्न करता है। उन्होंने एक नई सुविधा पेश की है, उपयोगकर्ता टेक्स्ट इनपुट करके विभिन्न वास्तविक संगीत प्रभाव उत्पन्न कर सकते हैं, जो फिल्मों, खेलों, लघु वीडियो आदि उद्योगों में बड़ी मदद करेगा। ऑडियो प्रभाव जनरेशन के अलावा, वे आवाज़ क्लोनिंग और टेक्स्ट-टू-स्पीच जैसी शक्तिशाली सुविधाएँ भी प्रदान करते हैं।
【AiBase सारांश:】
🔊 अपलोड किए गए वीडियो के लिए ऑटो डबिंग, उपयुक्त ऑडियो प्रभाव उत्पन्न करता है।
🎶 टेक्स्ट इनपुट करके विभिन्न वास्तविक संगीत प्रभाव उत्पन्न करें, जो फिल्मों, खेलों, लघु वीडियो उद्योग में मदद करता है।
🎤 आवाज़ क्लोनिंग और टेक्स्ट-टू-स्पीच सुविधाएँ प्रदान करता है, सामग्री को अधिक जीवंत बनाने के लिए।
टेक्स्ट-टू-ऑडियो प्रवेश: https://top.aibase.com/tool/elevenlabs-wenbenzhuanyinxiaoapi
वीडियो ऑटो डबिंग प्रवेश: https://top.aibase.com/tool/elevenlabs-texts-to-sounds-effects-api
7. Tencent WeChat वीडियो नंबर ने डिजिटल व्यक्तियों को बिक्री में सीमित करने की योजना बनाई है
Tencent वीडियो नंबर ने हाल ही में "वीडियो नंबर विंडो达人发布低质量内容实施细则" के संशोधन की घोषणा की है, जिसका उद्देश्य सामग्री की गुणवत्ता की निगरानी को मजबूत करना है, और डिजिटल व्यक्तियों के लाइव स्ट्रीमिंग बिक्री को प्रतिबंधित करने की योजना बनाई है। यह संशोधन इस वर्ष 7 जून से 13 जून तक सार्वजनिक रूप से विचार मांगेगा।
【AiBase सारांश:】
⭐️ संशोधित नियम का उद्देश्य वीडियो नंबर सामग्री गुणवत्ता की निगरानी को मजबूत करना है।
⭐️ डिजिटल व्यक्तियों के लाइव स्ट्रीमिंग बिक्री को प्रतिबंधित करना, गैर-प्रामाणिक लाइव सामग्री को स्पष्ट रूप से प्रतिबंधित करना।
⭐️ प्लेटफार्म ने उल्लंघन करने वालों के खिलाफ उचित दंड उपाय लागू करने का निर्णय लिया है।
विवरण: https://www.chinaz.com/2024/0618/1624007.shtml
8. Stability AI का SD3 लाइसेंस मुद्दों के कारण विरोध का सामना कर रहा है, CivitAI समुदाय ने संबंधित सामग्री पर प्रतिबंध लगा दिया
Stability AI द्वारा हाल ही में जारी किए गए महत्वपूर्ण मॉडल SD3 ने लाइसेंस मुद्दों के कारण विवाद पैदा किया है, और AI समुदाय का विरोध का सामना कर रहा है। CivitAI समुदाय ने SD3 से संबंधित सामग्री पर प्रतिबंध लगा दिया है, जिससे लाइसेंस अनुबंध विवाद पैदा हुआ है। कंपनी ने उपभोक्ताओं के लिए एक निर्माता लाइसेंस पेश किया है, जो डेवलपर्स की शर्तों और चित्र निर्माण की संख्या को सीमित करता है। SD3 में कुछ विशेष मानव मुद्रा उत्पन्न करने में असमर्थता जैसी समस्याएँ हैं, भविष्य अनिश्चित है। CEO की विदाई और छंटनी के बाद, कंपनी को नए लाइसेंस अनुबंध के प्रभाव को स्पष्ट करना होगा। यह पूरा विवाद AI समुदाय और ओपन-सोर्स मॉडल विकास पर संभावित प्रभाव डाल सकता है।
【AiBase सारांश:】
💥 SD3 लाइसेंस मुद्दों ने विवाद पैदा किया, AI समुदाय का विरोध।
🔒 कंपनी ने निर्माता लाइसेंस पेश किया, डेवलपर्स की शर्तों और चित्र निर्माण की संख्या को सीमित किया।
❓ SD3 में कुछ विशेष मानव मुद्रा उत्पन्न करने में असमर्थता जैसी समस्याएँ हैं, भविष्य अनिश्चित है।
9. LEGO प्रिंटर Pixelbot 3000
यह लेख YouTube चैनल के निर्माता @Creative Mindstorms द्वारा डिजाइन किए गए Pixelbot3000 LEGO प्रिंटर के बारे में है, जो कस्टम कोड और कृत्रिम बुद्धिमत्ता का उपयोग करके LEGO मोज़ेक उत्पन्न करता है। उपयोगकर्ता केवल कला कार्य का नाम दर्ज करते हैं, AI चित्र उत्पन्न करता है और Pixelbot3000 स्वचालित रूप से मोज़ेक को इकट्ठा करता है।
【AiBase सारांश:】
🤖 कस्टम कोड और कृत्रिम बुद्धिमत्ता का उपयोग करके, Pixelbot3000 स्वचालित रूप से LEGO मोज़ेक उत्पन्न कर सकता है, प्रिंटिंग प्रक्रिया को सरल बनाता है।
🎨 Pixelbot3000 OpenAI के DALL-E3 का उपयोग करके कार्टून शैली में सरल चित्र उत्पन्न करता है, जो अंततः उच्च विपरीतता वाले स्केल चित्र उत्पन्न करता है।
🔧 Pixelbot3000 AI द्वारा उत्पन्न चित्र को विभाजित करके और प्रत्येक वर्ग के केंद्र पिक्सेल के रंग का नमूना लेकर बेहतर मोज़ेक पैटर्न प्राप्त करता है।
10. शोधकर्ताओं ने AI को मानव रेखाचित्र पहचानना सिखाया
यह लेख सरे विश्वविद्यालय और स्टैनफोर्ड विश्वविद्यालय के शोध टीम द्वारा विकसित नई विधि के बारे में है, जिसने कृत्रिम बुद्धिमत्ता को मानव रेखाचित्र की समझ की महत्वपूर्णता और परिणाम सिखाए हैं। रेखाचित्र और पाठ विवरणों को मिलाकर, कृत्रिम बुद्धिमत्ता ने मानव स्तर की समझ क्षमता प्रदर्शित की है, जटिल दृश्यों में वस्तुओं की सटीक पहचान और लेबलिंग की। यह शोध मानव-मशीन इंटरैक्शन और डिज़ाइन कार्य प्रवाह के लिए नई संभावनाएँ लाता है।
【AiBase सारांश:】
🧠 कृत्रिम बुद्धिमत्ता ने रेखाचित्र की समझ की महत्वपूर्णता सीखी, मानव स्तर के प्रदर्शन को प्रदर्शित किया।
🌳 कृत्रिम बुद्धिमत्ता 85% सटीकता के साथ पतंग, पेड़, जिराफ जैसी वस्तुओं की पहचान और लेबलिंग कर सकती है, अन्य मॉडलों को पार करती है।
🎨 नई विधि न केवल गैर-कलाकारों द्वारा बनाए गए रेखाचित्रों के लिए उपयुक्त है, बल्कि बिना स्पष्ट प्रशिक्षण के वस्तुओं के चित्रण के लिए भी उपयुक्त है।
विवरण लिंक: https://arxiv.org/abs/2312.12463
11. शोध: AI द्वारा उत्पन्न चित्रों ने इस्लामी वास्तुकला संस्कृति के सूक्ष्म अंतर को सही ढंग से प्रस्तुत नहीं किया