आपका स्वागत है 【AI दैनिक】 कॉलम में! यहाँ हर दिन कृत्रिम बुद्धिमत्ता की दुनिया का अन्वेषण करने के लिए आपका मार्गदर्शक है, हर दिन हम आपको AI क्षेत्र की हॉट सामग्री प्रस्तुत करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी प्रवृत्तियों को समझने में मदद करते हैं और नवीन AI उत्पादों के अनुप्रयोगों को समझाते हैं।
नवीनतम AI उत्पादजानने के लिए क्लिक करें:https://top.aibase.com/
1. स्टेप-वीडियो जनरेटिव मॉडल Step-Video का बीटा परीक्षण शुरू, आवेदन के लिए युएन वीडियो पर जाएं
स्टेप-वीडियो मॉडल का आधिकारिक बीटा परीक्षण शुरू हो गया है, उपयोगकर्ता युएन वीडियो की आधिकारिक वेबसाइट के माध्यम से आवेदन कर सकते हैं। यह मॉडल टेक्स्ट से 1080P रिज़ॉल्यूशन तक, अधिकतम 10 सेकंड के वीडियो उत्पन्न करने का समर्थन करता है, जो स्वचालित रूप से संकेतों, सौंदर्यशास्त्र और गति नियंत्रण के अनुकूलन में महत्वपूर्ण लाभ प्रदर्शित करता है।
【AiBase सारांश:】
🎬 स्टेप-वीडियो मॉडल टेक्स्ट से उच्च गुणवत्ता वाले वीडियो उत्पन्न करने का समर्थन करता है, रिज़ॉल्यूशन 1080P तक है, और अधिकतम 10 सेकंड तक का वीडियो बनाता है।
🌟 सौंदर्यशास्त्र में, स्टेप-वीडियो चीनी शैली के विषयों को समझने और उत्पन्न करने में विशेष रूप से सटीक है, प्राचीन कविता की भावना के अनुरूप।
⚙️ यह मॉडल गति नियंत्रण में उत्कृष्टता प्रदर्शित करता है, भौतिक नियमों के अनुसार वीडियो उत्पन्न कर सकता है और जटिल स्थानिक संबंधों को संभाल सकता है।
विवरण लिंक:https://top.aibase.com/tool/yuewenshipin
2. लुमा ने नया इमेज जनरेटिव मॉडल लुमा फोटॉन लॉन्च किया, तेज गति और कम लागत!
लुमा लैब्स द्वारा पेश किए गए लुमा फोटॉन और फोटॉन फ्लैश दो क्रांतिकारी इमेज जनरेटिव मॉडल हैं, जो अत्यधिक तेज उत्पादन गति और कम लागत के लाभ के साथ आते हैं। लुमा फोटॉन कई परीक्षणों में उत्कृष्ट प्रदर्शन करता है, उच्च गुणवत्ता वाली छवियाँ उत्पन्न कर सकता है, और विज्ञापन, फिल्म, कला जैसे विभिन्न क्षेत्रों में उपयुक्त है।
【AiBase सारांश:】
🚀 लुमा फोटॉन की इमेज उत्पादन गति बाजार के अन्य मॉडलों की तुलना में 10 गुना है, और 1080p छवि के लिए लागत केवल 0.2 सेंट है।
🎨 यह कई राउंड की प्राकृतिक भाषा निर्देशों का समर्थन करता है, उपयोगकर्ता उत्पन्न सामग्री को चरणबद्ध तरीके से अनुकूलित कर सकते हैं, जटिल रचनात्मक कार्यों के लिए उपयुक्त है।
📈 गुणवत्ता, रचनात्मकता और समझ में, लुमा फोटॉन ने डुअल-ब्लाइंड मूल्यांकन में बाजार के सभी मॉडलों को पीछे छोड़ दिया।
विवरण लिंक:https://lumalabs.ai/photon
3. कोलिंग AI डायरेक्टर सह-निर्माण योजना 6 दिसंबर को लॉन्च होगी, 9 फिल्म स्तर के AI वीडियो जारी किए जाएंगे
क्वाइशो टेक्नोलॉजी ने घोषणा की है कि 6 दिसंबर को चीन की पहली AIGC डायरेक्टर सह-निर्माण योजना - "कोलिंग AI डायरेक्टर सह-निर्माण योजना" आधिकारिक तौर पर लॉन्च होगी। यह योजना क्वाइशो द्वारा विकसित वीडियो जनरेटिव बड़े मॉडल "कोलिंग AI" के साथ कई प्रसिद्ध निर्देशकों द्वारा शुरू की गई है, जिसका उद्देश्य AI तकनीक के माध्यम से फिल्म और टीवी रचनाओं की सीमाओं को विस्तारित करना है।
【AiBase सारांश:】
🎥 यह योजना क्वाइशो टेक्नोलॉजी और 9 प्रसिद्ध निर्देशकों द्वारा शुरू की गई है, जिसमें विभिन्न विषयों को शामिल किया गया है।
🤖 सभी लघु फिल्में कोलिंग AI का उपयोग करके वीडियो जनरेशन के लिए बनाई जाएंगी, जो फिल्म और टीवी रचनाओं में AI तकनीक के अनुप्रयोग को बढ़ावा देती है।
📈 कोलिंग AI के लॉन्च के बाद से 5 मिलियन से अधिक उपयोगकर्ताओं की सेवा की है, 51 मिलियन वीडियो और 150 मिलियन छवियाँ उत्पन्न की हैं।
4. बाइटडांस के जिमेंग AI ने इमेज 2.1 मॉडल लॉन्च किया, AI जनरेटेड छवियाँ अब चीनी फॉन्ट के साथ!
बाइटडांस के जिमेंग AI ने हाल ही में इमेज 2.1 मॉडल लॉन्च किया है, जिसने AI इमेज जनरेशन में चीनी फॉन्ट की समस्या का समाधान किया है। उपयोगकर्ता केवल सरल टेक्स्ट विवरण दर्ज करके व्यक्तिगत पोस्टर तेजी से उत्पन्न कर सकते हैं, जिससे डिजाइनरों की कार्यक्षमता में काफी सुधार होता है। नए मॉडल के अनुप्रयोग परिदृश्य व्यापक हैं, जिसमें पोस्टर निर्माण, पुस्तक कवर डिजाइन और सोशल मीडिया ग्राफिक्स शामिल हैं।
【AiBase सारांश:】
🎨 नया मॉडल चीनी फॉन्ट जनरेशन का समर्थन करता है, पोस्टर डिजाइन की दक्षता को बढ़ाता है।
📚 उपयोगकर्ता टेक्स्ट विवरण के माध्यम से व्यक्तिगत पोस्टर और कवर बना सकते हैं।
🌌 मॉडल के अनुप्रयोग परिदृश्य व्यापक हैं, जो सोशल मीडिया, कहानी निर्माण आदि के लिए उपयुक्त हैं।
विवरण लिंक:https://top.aibase.com/tool/jimeng
5. मिता AI खोज: "शैक्षणिक खोज" डेटा 7 गुना बढ़ा, "व्याख्या" सुविधा जोड़ी गई
शंघाई मिता नेटवर्क टेक्नोलॉजी कंपनी ने हाल ही में अपनी AI मिता शैक्षणिक खोज सुविधा में महत्वपूर्ण उन्नयन किया है, डेटा मात्रा 7 गुना बढ़ गई है, उपयोगकर्ता अब लाखों ओपन एक्सेस शोध पत्रों को अधिक व्यापक रूप से खोज सकते हैं, जिसमें 40% SCI पत्र और शीर्ष पत्रिकाएँ जैसे "नेचर" और "साइंस" शामिल हैं। इस अपडेट में "व्याख्या" सुविधा भी जोड़ी गई है, जो उपयोगकर्ताओं को जटिल साहित्य सामग्री को समझने में मदद करती है।
【AiBase सारांश:】
📈 डेटा मात्रा 7 गुना बढ़ गई है, लाखों ओपन एक्सेस शोध पत्रों को कवर किया गया है, खोज क्षमता को बढ़ाया गया है।
📝 "व्याख्या" सुविधा जोड़ी गई है, जो उपयोगकर्ताओं को साहित्य में जटिल वाक्यों को समझने में मदद करती है।
🌍 44 भाषाओं के लिए अनुवाद मॉडल का समर्थन, छोटे भाषा शोध पत्रों की पढ़ाई में बाधाओं को समाप्त करता है।
6. ली फेई फेई का उद्यमिता का पहला प्रदर्शन: एक चित्र से इंटरैक्टिव 3D दुनिया उत्पन्न करना, AIGC एक नए युग में प्रवेश करता है!
ली फेई फेई की नवीनतम उद्यमिता परियोजना वर्ल्ड लैब्स ने क्रांतिकारी 3D जनरेशन तकनीक पेश की है। उपयोगकर्ता केवल एक चित्र या एक वाक्य प्रदान करके इंटरैक्टिव 3D दृश्य बना सकते हैं, जो AIGC के नए इमर्सिव युग में प्रवेश को दर्शाता है। यह तकनीक न केवल विवरण को सटीकता से पुनः उत्पन्न कर सकती है, बल्कि विभिन्न कैमरा प्रभावों का अनुकरण भी कर सकती है, उपयोगकर्ताओं को निर्देशक के समान नियंत्रण की भावना देती है।
【AiBase सारांश:】
🖼️ केवल एक चित्र या एक वाक्य से जीवंत 3D दृश्य उत्पन्न किया जा सकता है, नया इंटरैक्टिव अनुभव शुरू होता है।
🎥 यह तकनीक विभिन्न कैमरा प्रभावों का अनुकरण करने का समर्थन करती है, जिससे उपयोगकर्ता 3D दुनिया में स्वतंत्र रूप से कैमरा को नियंत्रित कर सकते हैं।
🚀 वर्ल्ड लैब्स 3D दुनिया के पैमाने और सटीकता को लगातार बढ़ाने की योजना बना रहा है, अधिक उपयोगकर्ता इंटरैक्शन के तरीकों का अन्वेषण कर रहा है।
विवरण लिंक:https://www.worldlabs.ai/blog
7. वॉयस क्लोनिंग उल्लंघन को अलविदा! ह्यूम एआई ने व्यक्तिगत AI वॉयस बनाने के लिए वॉयस कंट्रोल फ़ीचर लॉन्च किया
ह्यूम एआई ने हाल ही में "वॉयस कंट्रोल" नामक एक प्रयोगात्मक सुविधा लॉन्च की है, जो उपयोगकर्ताओं को किसी भी कोडिंग कौशल की आवश्यकता के बिना आसानी से व्यक्तिगत AI आवाज बनाने की अनुमति देती है। यह सुविधा उपयोगकर्ताओं को ध्वनि विशेषताओं को समायोजित करने के लिए स्लाइडर का उपयोग करने की अनुमति देती है, जो कई आयामों में कस्टम विकल्प प्रदान करती है, जिसका उद्देश्य विविध अनुप्रयोग आवश्यकताओं को पूरा करना है।
【AiBase सारांश:】
🔊 ह्यूम एआई ने "वॉयस कंट्रोल" फ़ीचर लॉन्च किया, उपयोगकर्ता आसानी से व्यक्तिगत AI आवाज बना सकते हैं।
🛠️ इस सुविधा कोडिंग कौशल की आवश्यकता नहीं है, उपयोगकर्ता ध्वनि विशेषताओं को स्लाइडर के माध्यम से समायोजित कर सकते हैं।
🌐 ह्यूम का उद्देश्य व्यक्तिगत और भावनात्मक बुद्धिमत्ता वाली आवाज AI के माध्यम से विविध अनुप्रयोग आवश्यकताओं को पूरा करना है।
विवरण लिंक:https://www.hume.ai/blog/introducing-voice-control
8. कोहेर ने नया खोज मॉडल Rerank3.5 पेश किया: 100 से अधिक भाषाओं के सटीक प्रश्नों को संभाल सकता है
कोहेर द्वारा हाल ही में लॉन्च किया गया Rerank3.5 खोज मॉडल, कॉर्पोरेट डेटा खोज में एक महत्वपूर्ण प्रगति को चिह्नित करता है। यह मॉडल 100 से अधिक भाषाओं के प्रश्नों का समर्थन करता है, विशेष रूप से प्रमुख व्यावसायिक भाषाओं जैसे कि अरबी, जापानी और कोरियाई में उत्कृष्टता प्रदर्शित करता है, जो बहुराष्ट्रीय कंपनियों को भाषा बाधाओं को तोड़ने में मदद करता है। आंतरिक परीक्षणों से पता चलता है कि Rerank3.5 ने वित्तीय सेवाओं के क्षेत्र में प्रदर्शन में महत्वपूर्ण सुधार किया है, जिससे लागत में बचत और जोखिम में कमी आती है।
【AiBase सारांश:】
📊 Rerank3.5 100 से अधिक भाषाओं के प्रश्नों को संभाल सकता है, वैश्विक कंपनियों को भाषा बाधाओं को तोड़ने में मदद करता है।
💡 आंतरिक परीक्षणों से पता चलता है कि इस मॉडल ने वित्तीय सेवाओं के क्षेत्र में खोज प्रदर्शन में महत्वपूर्ण सुधार किया है, जिससे लागत में बचत और जोखिम में कमी आती है।
🚀 कोहेर मुख्य क्लाउड प्लेटफार्मों के माध्यम से तैनाती के माध्यम से कॉर्पोरेट खोज के उद्योग मानक बनने का प्रयास कर रहा है, जबकि कंपनियों को तेजी से बदलते AI वातावरण के अनुकूल होना चाहिए।
विवरण लिंक:https://cohere.com/blog/rerank-3pt5
9. OpenAI CFO ने विज्ञापन की अफवाहों का जवाब दिया: वर्तमान में विज्ञापन मॉडल को लागू करने पर विचार नहीं किया जा रहा है
OpenAI की CFO सारा फ्रायर ने एक साक्षात्कार में कहा कि वर्तमान में कंपनी विज्ञापन लागू करने की योजना नहीं बना रही है, हालांकि विज्ञापन राजस्व लाभकारी कंपनियों के लिए एक आकर्षक विकल्प है। फ्रायर ने उल्लेख किया कि OpenAI तेजी से बढ़ रहा है और मौजूदा व्यावसायिक मॉडल में अवसर खोज रहा है, भविष्य में अन्य राजस्व स्रोतों का अन्वेषण कर सकता है।
【AiBase सारांश:】
🌟 OpenAI CFO सारा फ्रायर ने कहा कि वर्तमान में विज्ञापन लागू करने का इरादा नहीं है, भविष्य में अन्य राजस्व स्रोतों का अन्वेषण संभव है।
💼 OpenAI ने कई विज्ञापन और विपणन क्षेत्र के विशेषज्ञों को भर्ती किया है, यह दर्शाता है कि भविष्य में विज्ञापन मॉडल पर विचार किया जा सकता है।
🚪 कंपनी के शीर्ष अधिकारियों में बार-बार बदलाव हो रहा है, संस्थापक सैम आल्टमैन अभी भी कंपनी के दृष्टिकोण को आगे बढ़ाने के लिए प्रयासरत हैं।
10. "डेविड मेयर" शब्द का उल्लेख करते ही ChatGPT क्रैश हो जाता है, यह क्या रहस्यमय शक्ति है?
हाल ही में, सोशल मीडिया पर एक उलझन भरा मामला सामने आया है: OpenAI का चैटबॉट ChatGPT "डेविड मेयर" का उल्लेख करते समय सामान्य प्रतिक्रिया नहीं दे पा रहा है और बातचीत को मजबूरन समाप्त कर रहा है। इस घटना ने इंटरनेट उपयोगकर्ताओं के बीच व्यापक चर्चा और अटकलों को जन्म दिया है, कई लोगों ने ChatGPT से "डेविड मेयर" के बारे में जानकारी पूछने की कोशिश की, लेकिन सभी को समान परिणाम का सामना करना पड़ा।
【AiBase सारांश:】
🌐 ChatGPT "डेविड मेयर" का उल्लेख करते ही प्रतिक्रिया नहीं दे पा रहा है और बातचीत को मजबूरन समाप्त कर रहा है।
🔍 "डेविड मेयर" संभवतः कानूनी मुद्दों से संबंधित है, जो GDPR के भुलाने के अधिकार को शामिल करता है।
🤔 अन्य नाम भी ChatGPT में समस्या उत्पन्न कर सकते हैं, जो AI मॉडल की जटिलता को उजागर करता है।
11. WPS Office ने AI वॉयस ट्रांसक्रिप्शन सुविधा पेश की
WPS Office ने हाल ही में AI वॉयस ट्रांसक्रिप्शन सुविधा पेश की है, जो वॉयस से टेक्स्ट में अनुभव को बढ़ाती है, वास्तविक समय में रिकॉर्डिंग और कई भाषाओं के अनुवाद का समर्थन करती है। यह सुविधा वॉयस प्रिंट पहचान और AI स्वचालित सारांश के माध्यम से सटीकता बढ़ाती है, और WPS क्लाउड दस्तावेजों के साथ गहन एकीकरण करती है, यह सुनिश्चित करती है कि उपयोगकर्ता रिकॉर्डिंग के दौरान सुचारू रूप से रिकॉर्डिंग जारी रख सकें। उपयोगकर्ता नवीनतम WPS Office संस्करण में आसानी से इस सुविधा को खोज सकते हैं और उपयोग कर सकते हैं।