आपका स्वागत है 【AI दैनिक】 कॉलम में! यह आपके लिए हर दिन आर्टिफिशियल इंटेलिजेंस की दुनिया का अन्वेषण करने का गाइड है, हर दिन हम आपको AI क्षेत्र की हॉट सामग्री प्रस्तुत करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी प्रवृत्तियों को समझने और नवोन्मेषी AI उत्पादों के अनुप्रयोगों को जानने में आपकी मदद करते हैं।
ताज़ा AI उत्पादजानने के लिए क्लिक करें:https://top.aibase.com/
1. प्रसारण प्रशासन ने AI "जादुई सुधार" घटना को नियंत्रित करने के लिए "प्रबंधन सुझाव" जारी किए, क्लासिक फिल्मों का मजाक उड़ाया गया
प्रसारण प्रशासन ने AI "जादुई सुधार" वीडियो घटनाओं के लिए प्रबंधन सुझाव जारी किए, क्लासिक संस्कृति की रक्षा के लिए शासन उपायों पर जोर दिया। हाल ही में कई क्लासिक फिल्में और टीवी शो मजाक में परिवर्तित किए गए, जिससे पारंपरिक संस्कृति पर जन जागरूकता बढ़ी। प्रबंधन ने सभी प्रांतीय कार्यालयों से संबंधित सामग्री को साफ करने और जनरेटिव AI सामग्री की समीक्षा को लागू करने का अनुरोध किया, ताकि गलत जानकारी और उल्लंघन को रोका जा सके।
【AiBase सारांश:】
🚫 प्रसारण प्रशासन ने सुझाव जारी किया, AI "जादुई सुधार" वीडियो घटना को नियंत्रित करने की मांग की, क्लासिक संस्कृति की रक्षा के लिए।
🎥 कई क्लासिक फिल्में मजाक में परिवर्तित की गईं, पारंपरिक संस्कृति के प्रति जन जागरूकता को प्रभावित किया।
🔍 प्लेटफार्मों को जनरेटिव AI सामग्री की सख्त समीक्षा करनी चाहिए, गलत जानकारी और कॉपीराइट उल्लंघन से बचना चाहिए।
2. Hai Luo AI का विदेशी संस्करण सुपर AI वॉयस क्लोनिंग फ़ीचर लॉन्च
Hai Luo AI ने हाल ही में अपने विदेशी संस्करण का ऑडियो क्लोनिंग मॉड्यूल लॉन्च किया है, उपयोगकर्ता केवल 10 से 60 सेकंड के ऑडियो नमूने की मदद से अपनी आवाज़ को पूरी तरह से पुन: प्रस्तुत कर सकते हैं। यह तकनीकी प्रगति चीनी वॉयस क्लोनिंग क्षेत्र में व्यापक ध्यान आकर्षित कर रही है, और कई उपयोगकर्ता इसकी उत्कृष्ट ऑडियो क्लोनिंग क्षमता से हैरान हैं। यह प्रणाली न केवल सरल है, बल्कि यह कई भाषाओं और भावनाओं का समर्थन करती है, जो उपयोगकर्ताओं की आवश्यकताओं को काफी हद तक पूरा करती है।
【AiBase सारांश:】
🌟 केवल 10 से 60 सेकंड के ऑडियो के साथ, Hai Luo AI उपयोगकर्ताओं की आवाज़ को पूरी तरह से पुन: प्रस्तुत कर सकता है, चीनी वॉयस क्लोनिंग की बाधाओं को तोड़ता है।
🎤 प्रणाली 12 भाषाओं का समर्थन करती है, उपयोगकर्ता विभिन्न भावनाओं का चयन कर सकते हैं, जिससे वॉयस प्रदर्शन समृद्ध होता है।
💻 वर्तमान में Hai Luo AI ऑडियो फ़ीचर मुफ्त है, उपयोगकर्ता आसानी से कई आवाज़ मॉडल बना सकते हैं।
विवरण लिंक: https://www.hailuo.ai/audio
3. Runway Act One अपडेट: अपने प्रदर्शन और आवाज़ को वीडियो पात्रों में seamlessly एकीकृत करें
Runway Act One का नवीनतम अपडेट वीडियो निर्माण में क्रांतिकारी बदलाव लाता है, जिससे उपयोगकर्ता अपने प्रदर्शन और आवाज़ को सीधे अन्य वीडियो पात्रों पर लागू कर सकते हैं, जिससे पूर्ण समन्वय संभव होता है। यह तकनीकी प्रगति न केवल निर्माण के लिए बाधाओं को कम करती है, बल्कि फिल्म निर्माण के लिए अभूतपूर्व लचीलापन प्रदान करती है, जिससे निर्माता कहीं भी ऑडिशन और प्रदर्शन स्थानांतरित कर सकते हैं।
【AiBase सारांश:】
🎭 बहुआयामी प्रदर्शन स्थानांतरण: क्रियाएँ, आवाज़ और भावनाएँ किसी भी पात्र पर seamlessly स्थानांतरित की जा सकती हैं।
📱 सुविधाजनक ऑडिशन: अभिनेता कभी भी अपने फोन से शूट कर सकते हैं, लक्ष्य पात्र पर प्रदर्शन को आसानी से स्थानांतरित कर सकते हैं।
🖥️ AI संयोजन: Midjourney जैसे उपकरणों का उपयोग करके, निर्माता छोटे वीडियो को पूर्ण प्रदर्शन में विस्तारित कर सकते हैं।
विवरण लिंक: https://top.aibase.com/tool/runway
4. OpenAI जल्द ही नया Sora वीडियो जनरेटर लॉन्च करेगा, कई जनरेशन विधियों का समर्थन करेगा
OpenAI ने हाल ही में लंदन में C21Media सम्मेलन में नए संस्करण के Sora वीडियो जनरेटर की घोषणा की, जो टेक्स्ट, छवि और वीडियो के कई जनरेशन विधियों का समर्थन करेगा, जिससे उपयोगकर्ता के वीडियो निर्माण अनुभव में काफी सुधार होगा। नए संस्करण में दक्षता और गति में महत्वपूर्ण सुधार हुआ है, और उम्मीद है कि इसे दिसंबर के शीतकालीन प्रचार अभियान में आधिकारिक रूप से लॉन्च किया जाएगा, साथ ही GPT-4.5 जैसे अन्य नए फीचर्स भी पेश किए जा सकते हैं।
【AiBase सारांश:】
🌟 नया संस्करण Sora वीडियो जनरेटर टेक्स्ट, छवि और वीडियो जनरेशन का समर्थन करेगा, निर्माण में लचीलापन बढ़ाएगा।
🚀 नए जनरेटर में गति और दक्षता में महत्वपूर्ण सुधार है, उपयोगकर्ता अनुभव को बढ़ाता है।
📅 उम्मीद है कि इसे दिसंबर के शीतकालीन प्रचार अभियान में लॉन्च किया जाएगा, संभवतः GPT-4.5 जैसे नए फीचर्स के साथ।
5. सुपर वीडियो सुधार उपकरण VISION XL धुंधला वीडियो एक क्लिक में स्पष्ट करें
तकनीकी प्रगति के साथ, VISION XL एक वीडियो सुधार और सुपर-रिज़ॉल्यूशन उपकरण के रूप में अपनी उत्कृष्टता और उपयोगिता के लिए उभरा है। यह न केवल वीडियो के गायब हिस्सों को सुधारता है और धुंधलापन हटाता है, बल्कि वीडियो की स्पष्टता को भी चार गुना तक बढ़ा सकता है। इसका संभावित प्रसार मॉडल पर आधारित प्रसंस्करण ढांचा अतिरिक्त पूर्व-प्रशिक्षण मॉड्यूल पर निर्भरता को कम करता है, जिससे उच्च रिज़ॉल्यूशन वीडियो के प्रसंस्करण की दक्षता में काफी सुधार होता है।
【AiBase सारांश:】
✨ VISION XL वीडियो के गायब हिस्सों को सुधार सकता है, धुंधलापन हटा सकता है, स्पष्टता बढ़ा सकता है, अधिकतम चार गुना सुपर-रिज़ॉल्यूशन तक।
⚙️ संभावित प्रसार मॉडल पर आधारित प्रसंस्करण ढांचे का उपयोग करते हुए, अतिरिक्त पूर्व-प्रशिक्षण मॉड्यूल पर निर्भरता को कम करता है, प्रसंस्करण दक्षता बढ़ाता है।
🚀 केवल 13GB वीडियो मेमोरी की आवश्यकता होती है 25 फ्रेम वीडियो को संसाधित करने के लिए, प्रसंस्करण का समय 2.5 मिनट से अधिक नहीं होता है, तेज़ अनुप्रयोग परिदृश्यों के लिए उपयुक्त।
विवरण लिंक: https://vision-xl.github.io/
6. मस्क के अधीन सोशल नेटवर्क प्लेटफॉर्म X पर इमेज जनरेटर Aurora लॉन्च
एलन मस्क के सोशल नेटवर्क X ने हाल ही में नया इमेज जनरेटर Aurora लॉन्च किया है, जिसका उद्देश्य फोटो जैसी वास्तविक छवियाँ बनाना है। हालाँकि लॉन्च के बाद कुछ उपयोगकर्ता इस फ़ीचर का उपयोग नहीं कर पाए, लेकिन Aurora उपयोगकर्ताओं को सार्वजनिक और कॉपीराइट वाले पात्रों की छवियाँ बनाने की अनुमति देता है, और कोई प्रतिबंध नहीं है। यह उपकरण स्थिर वस्तुओं और परिदृश्य छवियों को बनाने में उत्कृष्टता दिखाता है, लेकिन इसमें कुछ कमियाँ भी हैं, जैसे छवि में वस्तुओं का अस्वाभाविक रूप से विलय होना और व्यक्तियों के अंगों का गायब होना।
【AiBase सारांश:】
🌟 नया इमेज जनरेटर Aurora लॉन्च किया गया, उपयोगकर्ता विभिन्न छवियाँ बना सकते हैं।
🚫 कुछ उपयोगकर्ताओं को लॉन्च के कुछ घंटों के भीतर इस फ़ीचर का उपयोग नहीं मिल पाया।
💰 X सोशल प्लेटफॉर्म ने सभी उपयोगकर्ताओं के लिए Grok फ़ीचर को खोला।
7. गूगल ने नया Gemini-Exp-1206 मॉडल लॉन्च किया, ChatGPT को पीछे छोड़कर AI का नया राजा बना
गूगल द्वारा हाल ही में लॉन्च किया गया Gemini-Exp-1206 मॉडल जनरेटिव AI क्षेत्र में व्यापक ध्यान आकर्षित कर रहा है, 1379 के उच्च स्कोर के साथ LMArena रैंकिंग में ChatGPT-4.0 के 1366 अंक को पीछे छोड़ते हुए, अपनी उत्कृष्ट समग्र क्षमताओं को प्रदर्शित कर रहा है। हालांकि Gemini-Exp-1206 कई परीक्षणों में उत्कृष्ट प्रदर्शन करता है, लेकिन वोटों की संख्या में ChatGPT-4.0 से पीछे है, जो बाद के विश्वसनीयता के लाभ को दर्शाता है।
【AiBase सारांश:】
🌟 Gemini-Exp-1206 ने LMArena रैंकिंग में 1379 अंक प्राप्त किए, ChatGPT-4.0 के 1366 अंक को पीछे छोड़ते हुए।
🗳️ ChatGPT-4.0 को 21,929 वोट मिले, जो स्पष्ट रूप से Gemini-Exp-1206 के 5052 वोटों से अधिक हैं, जो इसकी विश्वसनीयता को दर्शाता है।
🔍 Gemini प्रयोगात्मक मॉडल डेवलपर्स को अभूतपूर्व AI अनुभव के अवसर प्रदान करता है, लेकिन अभी भी परीक्षण चरण में है, उत्पादन के लिए उपयुक्त नहीं है।
विवरण लिंक: https://ai.google.dev/gemini-api/docs/models/experimental-models?hl=zh-cn
8. NegToMe इमेज जनरेशन को फिर से परिभाषित करता है: कॉपीराइट जोखिम को कम करना, विविधता बढ़ाना और दृश्य प्रभाव में सुधार करना
NegToMe एक परिवर्तनकारी इमेज जनरेशन तकनीक है, जो इमेज-ड्रिवेन प्रतिकूलता मार्गदर्शन विधियों का उपयोग करके पारंपरिक नकारात्मक संकेतों की सीमाओं को पार करती है, जनरेटेड इमेज की विविधता और गुणवत्ता में महत्वपूर्ण सुधार करती है। यह जनरेटेड सामग्री और कॉपीराइट कार्यों के बीच समानता को कम करके कॉपीराइट सुरक्षा की समस्या को हल करती है, और क्रॉस-डोमेन अनुप्रयोगों में भी उत्कृष्टता दिखाती है, जिससे निर्माताओं को अधिक रचनात्मक स्वतंत्रता मिलती है।
【AiBase सारांश:】
🎨 NegToMe इमेज-ड्रिवेन प्रतिकूलता मार्गदर्शन विधियों के माध्यम से जनरेटेड इमेज की विविधता में महत्वपूर्ण सुधार करता है, विशेष रूप से जातीयता और लिंग के उपचार में।
🔒 यह तकनीक जनरेटेड सामग्री और कॉपीराइट कार्यों के बीच समानता को कम करती है, परीक्षणों से दिखाया गया कि समानता 34.57% कम हो गई है, जो कॉपीराइट सुरक्षा की समस्या को प्रभावी ढंग से हल करती है।
⚙️ NegToMe को एकीकृत करना सुविधाजनक है, डेवलपर्स को केवल थोड़े से कोड की आवश्यकता होती है, और अनुमान समय लगभग अप्रभावित रहता है, यह कई प्रसार मॉडल के साथ संगत है।
विवरण लिंक: https://github.com/1jsingh/negtome
9. X ने सभी उपयोगकर्ताओं के लिए Grok AI खोल दिया, सामान्य उपयोगकर्ता भी मुफ्त में जीवित चित्र बना सकते हैं
xAI ने हाल ही में घोषणा की कि उसका चैटबॉट Grok अब वैश्विक उपयोगकर्ताओं के लिए खुला है, जो एक कम लागत वाला AI अनुभव प्रदान करता है। मुफ्त संस्करण में उपयोगकर्ताओं को कुछ उपयोग सीमाएँ हैं, जैसे कि दैनिक चित्र निर्माण और संदेश भेजने की संख्या की सीमाएँ। यह कदम न केवल अधिक उपयोगकर्ताओं को AI प्रौद्योगिकी के बारे में जानने के लिए आकर्षित करता है, बल्कि xAI की उत्पादों को बढ़ावा देने की व्यावसायिक रणनीति को भी दर्शाता है।
【AiBase सारांश:】
🖼️ Grok उपयोगकर्ताओं को प्रति दिन अधिकतम 3 चित्र बनाने या विश्लेषण करने की अनुमति देता है।
💬 उपयोगकर्ता दो घंटे में केवल 10 संदेश भेज सकते हैं, उपयोग की आवृत्ति को नियंत्रित करने के लिए।
📈 xAI उपयोगकर्ताओं को आकर्षित करने के लिए Grok को मुफ्त में खोलता है, भविष्य में और अधिक भुगतान किए गए फ़ीचर्स पेश कर सकता है।
10. Google Photos 2024 वार्षिक फोटो रिव्यू लॉन्च करता है: AI स्मार्ट जनरेशन, आपके शानदार क्षणों को रिकॉर्ड करता है
डिजिटल तकनीक के विकास के साथ, Google Photos ने 2024 वार्षिक फोटो रिव्यू फ़ीचर लॉन्च किया है, जो AI तकनीक का उपयोग करके उपयोगकर्ताओं को व्यक्तिगत अनुभव प्रदान करता है। Gemini AI के माध्यम से, उपयोगकर्ता स्मार्ट जनरेटेड फोटो लेबल प्राप्त कर सकते हैं, महत्वपूर्ण क्षणों और शूटिंग डेटा की समीक्षा कर सकते हैं। हालांकि यह फ़ीचर उपयोगकर्ताओं को सुंदर यादों को साझा करने का अवसर देता है, लेकिन यह कुछ अप्रिय यादों को भी उजागर कर सकता है।
【AiBase सारांश:】
🤖 AI तकनीक व्यक्तिगत फोटो लेबल जनरेट करती है, वार्षिक महत्वपूर्ण क्षणों को उजागर करती है।
📊 विस्तृत शूटिंग डेटा सांख्यिकी प्रदान करती है, उपयोगकर्ताओं को व्यक्तिगत मापदंड साझा करने में सुविधा देती है।
😢 यह कुछ अप्रिय यादों को उजागर कर सकता है, AI अभी भी उपयोगकर्ताओं की भावनात्मक आवश्यकताओं को पूरी तरह से समझ नहीं पाया है।
11. OpenAI ने सैन्य ठेकेदारों के साथ सहयोग करने का निर्णय लिया, आंतरिक कर्मचारी विरोध कर रहे हैं!
OpenAI और एंड्यूरिल के सहयोग ने कर्मचारियों की तीव्र प्रतिक्रियाएँ उत्पन्न की हैं, कई लोग सैन्य उपयोग में तकनीक के उपयोग के बारे में चिंतित हैं, अधिक पारदर्शिता की मांग कर रहे हैं। हालांकि प्रबंधन ने सहयोग को केवल रक्षा प्रणालियों तक सीमित करने पर जोर दिया, कर्मचारियों ने इस सीमा पर संदेह व्यक्त किया।
【AiBase सारांश:】