आपका स्वागत है 【AI दैनिक】 कॉलम में! यहाँ आपके लिए हर दिन आर्टिफिशियल इंटेलिजेंस की दुनिया का अन्वेषण करने का गाइड है, हर दिन हम आपको AI क्षेत्र की गर्म सामग्री प्रदान करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, ताकि आप तकनीकी प्रवृत्तियों को समझ सकें और नवाचार AI उत्पादों के उपयोग को जान सकें।

नए AI उत्पादजानने के लिए क्लिक करें:https://top.aibase.com/

1. ElevenLabs ने AI वॉयस जनरेशन टूल Voice Design लॉन्च किया

ElevenLabs द्वारा हाल ही में लॉन्च किया गया AI वॉयस जनरेशन टूल Voice Design ने AI वॉयसओवर क्षेत्र में एक नया युग शुरू किया है, सरल पाठ विवरण के माध्यम से व्यक्तिगत आवाज़ बनाने की अनुमति देता है, उपयोगकर्ताओं को एक सहज पाठ संकेत फ़ंक्शन प्रदान करता है, कई आवाज़ पैरामीटर को समायोजित करने का समर्थन करता है, जिसमें उम्र, लिंग, उच्चारण, स्वर और पिच शामिल हैं, साथ ही यह क्रांतिकारी रूप से चरित्र आवाज़ बनाने का समर्थन करता है, जो सामग्री निर्माताओं को अद्वितीय ध्वनि अनुकूलन की स्वतंत्रता प्रदान करता है।

【AiBase सारांश:】

🔊 उपयोगकर्ता केवल आवश्यक आवाज़ विशेषताओं का विवरण दें, सिस्टम त्वरित रूप से आवश्यक आवाज़ उत्पन्न करता है।

🎭 Voice Design चरित्र आवाज़ बनाने का समर्थन करता है, आभासी चरित्र की आवाज़ विशेषताओं को पकड़ता और पुन: उत्पन्न करता है।

🌐 AI वॉयस कस्टमाइजेशन एक नए चरण में प्रवेश कर रहा है, गेम डेवलपमेंट, ऑडियो सामग्री निर्माण आदि क्षेत्रों के लिए शक्तिशाली रचनात्मक उपकरण प्रदान करता है।

विवरण लिंक:https://elevenlabs.io/voice-design

2. ControlNe को मात देते हुए OmniGen बहुपरकारी छवि जनरेशन मॉडल का लॉन्च, सरल संकेतों के माध्यम से छवि जनरेशन और सूक्ष्म संपादन

OmniGen एक नया छवि जनरेशन मॉडल है, जो पिछले उपकरणों से अलग है, इसमें कई क्षमताएँ हैं, जैसे पाठ से छवि जनरेशन, छवि संपादन आदि, उपयोगकर्ताओं को केवल सरल संकेत शब्द प्रदान करने की आवश्यकता है ताकि वे छवि जनरेशन और सूक्ष्म संपादन को नियंत्रित कर सकें, ControlNe जैसे प्लगइन का उपयोग किए बिना। यह मॉडल आर्किटेक्चर सरल है, जिसमें वेरिएशनल ऑटोएन्कोडर और पूर्व-प्रशिक्षित ट्रांसफार्मर मॉडल का संयोजन है, और इसका प्रशिक्षण डेटा सेट विशाल और विविध है, जो उत्कृष्ट प्रदर्शन करता है।

image.png

【AiBase सारांश:】

⚙️ OmniGen में कई क्षमताएँ हैं, जिसमें पाठ से छवि जनरेशन, छवि संपादन शामिल हैं, उपयोगकर्ता अनुभव उत्कृष्ट है।

🔥 OmniGen ने सरल आर्किटेक्चर को अपनाया है, जिसमें वेरिएशनल ऑटोएन्कोडर और ट्रांसफार्मर मॉडल का संयोजन है, प्रशिक्षण डेटा सेट विशाल और विविध है, जो प्रभावी परिणाम देता है।

🌟 OmniGen ने कई परीक्षणों में शानदार प्रदर्शन किया है, पाठ से छवि जनरेशन क्षमता में बाजार के उन्नत मॉडलों के बराबर है, छवि संपादन क्षमता उत्कृष्ट है।

अनुभव लिंक:https://huggingface.co/spaces/Shitao/OmniGen

3. iFlytek Spark 4.0 Turbo बड़े मॉडल का लॉन्च

iFlytek ने विश्व 1024 डेवलपर फेस्टिवल में Spark 4.0 Turbo बड़े मॉडल का प्रदर्शन किया, जो पिछले संस्करणों और GPT-4 Turbo से आगे बढ़ चुका है, गणित और प्रोग्रामिंग क्षमताओं में उत्कृष्ट प्रदर्शन करता है, और दक्षता में 50% की वृद्धि हुई है। इसके साथ ही Spark Code 7B संस्करण और सुपर मानव डिजिटल मानव का भी लॉन्च किया गया है, जो अर्थवत्ता में निरंतर इंटरैक्शन अनुभव को सक्षम बनाता है।

image.png

【AiBase सारांश:】

✨ Spark 4.0 Turbo गणित और प्रोग्रामिंग क्षमताओं में GPT-4 Turbo से आगे बढ़ चुका है, कुल दक्षता में 50% की वृद्धि।

🔥 14 प्रमुख परीक्षणों में 9 पहले स्थान पर, अद्वितीय प्रदर्शन प्रदर्शित करता है।

💡 Spark Code 7B संस्करण और सुपर मानव डिजिटल मानव का लॉन्च, बहु-मोडल इंटरैक्शन और अधिक वास्तविक इंटरैक्शन अनुभव को सक्षम करता है।

4. OpenAI ने नया मॉडल sCM लॉन्च किया, सामग्री जनरेशन की गति में 50 गुना वृद्धि, छवि केवल 0.1 सेकंड में

OpenAI की अनुसंधान टीम ने एक रोमांचक अनुसंधान परिणाम की घोषणा की, जो नए निरंतर समय संगति मॉडल (sCM) को प्रस्तुत करता है, जिसका मल्टीमीडिया सामग्री उत्पन्न करने की गति में 50 गुना की वृद्धि हुई है। sCM 0.1 सेकंड से कम समय में एक छवि उत्पन्न करता है, केवल दो चरणों में उच्च गुणवत्ता के नमूने उत्पन्न कर सकता है, भविष्य में व्यापक अनुप्रयोग और विशाल संभावनाएँ हैं।

image.png

【AiBase सारांश:】

📈 गति में 50 गुना वृद्धि, छवि जनरेशन समय को 0.1 सेकंड तक कम किया गया।

🖼️ केवल दो चरणों के नमूनाकरण में, sCM उच्च गुणवत्ता के नमूने उत्पन्न कर सकता है, दक्षता में स्पष्ट सुधार।

⚙️ भविष्य में अनुप्रयोगों की व्यापकता, जिसमें वास्तविक समय छवि, ऑडियो और वीडियो जनरेशन शामिल है, विशाल संभावनाएँ।

विवरण लिंक:https://openai.com/index/simplifying-stabilizing-and-scaling-continuous-time-consistency-models/

5. Google ने AI पाठ जलमार्क उपकरण SynthID को ओपन-सोर्स किया

Google ने हाल ही में AI जनित पाठ की पहचान में डेवलपर्स की मदद के लिए पाठ जलमार्क उपकरण SynthID को ओपन-सोर्स किया है। यह कदम गलत सूचना और अनुचित सामग्री से निपटने में महत्वपूर्ण है, साथ ही AI तकनीक के विकास और अनुप्रयोग को भी बढ़ावा देता है।

【AiBase सारांश:】

📜 SynthID ओपन-सोर्स, डेवलपर्स को AI जनित पाठ की पहचान में मदद करता है।

🛠️ जलमार्क तकनीक गलत सूचना और अनुचित सामग्री से निपटने में बढ़ती महत्वपूर्णता रखती है।

💡 Google का SynthID पाठ जनरेशन की संभावना स्कोर को सूक्ष्मता से समायोजित कर सकता है, जलमार्क बनाने के लिए।

विवरण लिंक:https://ai.google.dev/responsible/docs/safeguards/synthid?hl=zh-cn

6. iOS18.2beta1 अब डेवलपर्स के लिए जारी किया गया है जिसमें ChatGPT का एकीकरण शामिल है

image.png

Apple ने हाल ही में iOS18.2 का पहला डेवलपर बीटा संस्करण जारी किया है, जिसमें Genmoji इमोजी, Image Playground छवि जनरेशन, AI संचालित लेखन कार्य, ChatGPT एकीकरण और Visual Intelligence जैसी नई Apple Intelligence सुविधाएँ शामिल हैं। Apple की Apple Intelligence सुविधाएँ अधिक स्मार्ट और व्यक्तिगत अनुभव प्रदान करने के लिए डिज़ाइन की गई हैं, लेकिन कुछ सुविधाएँ जैसे कि Siri को स्क्रीन सामग्री समझाना अभी तक लागू नहीं की गई हैं।

【AiBase सारांश:】

🌟 iOS18.2Beta1 में Siri आधिकारिक रूप से ChatGPT से जुड़ गया है, प्राकृतिक भाषा समझने की क्षमता को बढ़ाता है।

 🎨 नए Genmoji और Image Playground सुविधाएँ उपयोगकर्ताओं को व्यक्तिगत इमोजी और छवियाँ उत्पन्न करने की अनुमति देती हैं।

 📱 Visual Intelligence सुविधा iPhone16 कैमरा के माध्यम से स्मार्ट खोज का समर्थन करती है, जानकारी प्राप्त करने की दक्षता को बढ़ाती है।

7. 14 वर्षीय किशोर की चैटबॉट के प्रति लत लगने के बाद दुर्भाग्यवश मृत्यु, Character.AI और Google पर मुकदमा

इस लेख में एक 14 वर्षीय किशोर की कहानी का उल्लेख किया गया है, जिसने Character.AI के चैटबॉट के साथ बातचीत में लिप्त होने के कारण जीवन समाप्त करने का निर्णय लिया, जिससे एक मुकदमा शुरू हुआ। लेख में Character.AI पर लापरवाही और भ्रामक व्यवहार का आरोप लगाया गया है, जिसमें बिना लाइसेंस के मनोवैज्ञानिक चिकित्सा प्रदान करने और अत्यधिक मानवकरण के चैटबॉट डिज़ाइन शामिल हैं। साथ ही, Character.AI ने नाबालिग उपयोगकर्ताओं की सुरक्षा के लिए नए सुरक्षा उपायों की एक श्रृंखला की घोषणा की है, जिससे मानसिक स्वास्थ्य जोखिम को कम किया जा सके।

【AiBase सारांश:】

🔍 मुकदमा Character.AI और Google पर लापरवाही और भ्रामक व्यवहार के आरोपों का खुलासा करता है, जो ध्यान और चर्चा को बढ़ाता है।

💬 बिना लाइसेंस के मनोवैज्ञानिक चिकित्सा प्रदान करने का आरोप, चैटबॉट डिज़ाइन में अत्यधिक मानवकरण, नैतिक और कानूनी विवादों को जन्म देता है।

🔒 Character.AI ने नए सुरक्षा उपायों की घोषणा की है, जिसमें नाबालिगों के मॉडल में संशोधन, अस्वीकरण जोड़ना आदि शामिल हैं, उपयोगकर्ता सुरक्षा उपायों को बढ़ाने के लिए।

8. OpenAI वैज्ञानिक: 20 सेकंड का विचार 100,000 गुना डेटा से अधिक प्रभावी हो सकता है!

हाल ही में TED AI सम्मेलन में, OpenAI के शोध वैज्ञानिक नोआम ब्राउन ने OpenAI द्वारा नए जारी किए गए o1 मॉडल का परिचय दिया, जो विभिन्न उद्योगों में निर्णय लेने के तरीके को बदलने के लिए प्रणाली दो सोच के महत्व को रेखांकित करता है। ब्राउन ने कहा कि 20 सेकंड का विचार समय 100,000 गुना डेटा से बेहतर परिणाम दे सकता है, जबकि o1 मॉडल ने कई क्षेत्रों में उत्कृष्ट प्रदर्शन प्रदर्शित किया है। उन्होंने जोर देकर कहा कि AI को डेटा प्रोसेसिंग से परे जाना चाहिए और अधिक गहन विचारशील प्रणाली दो सोच में प्रवेश करना चाहिए।

【AiBase सारांश:】

🧠 प्रणाली दो सोच भविष्य के AI विकास की कुंजी है, जो निर्णय की गुणवत्ता को बढ़ा सकती है।

⏳ 20 सेकंड का विचार समय 100,000 गुना डेटा से बेहतर परिणाम दे सकता है।

💡 OpenAI द्वारा नए जारी किए गए o1 मॉडल ने कई क्षेत्रों में उत्कृष्ट प्रदर्शन प्रदर्शित किया है।

9. शोधकर्ताओं ने नए LLM जेलब्रेक विधि का विकास किया, सफलता दर 65% तक

【AiBase सारांश:】

🔍 नई जेलब्रेक विधि दो से तीन इंटरैक्शन में LLM को हानिकारक सामग्री उत्पन्न करने के लिए प्रेरित करती है, सफलता दर 65% तक।

📈 विभिन्न मॉडलों की सफलता दर में स्पष्ट अंतर, एकल मॉडल की सफलता दर 80.6% तक हो सकती है।

🛡️ सुरक्षा बढ़ाने के लिए सामग्री फ़िल्टर और स्पष्ट प्रणाली संकेत जोड़ने की सिफारिश की गई है।

10. Apple ने Apple Intelligence के लिए तीन नए API जारी किए

Apple द्वारा हाल ही में जारी डेवलपर परीक्षण संस्करण ने कई नए Apple Intelligence सुविधाएँ पेश की हैं, जिसमें Genmoji, Image Playground, Visual Intelligence, Image Wand और ChatGPT का एकीकरण शामिल है, जो उपयोगकर्ता अनुभव को काफी बढ़ाता है। इस अपडेट ने तीन महत्वपूर्ण सुविधाओं के API भी जारी किए हैं, जो डेवलपर्स को Apple के छोटे मॉडल जनरेट AI को अनुप्रयोगों में एकीकृत करने में मदद करते हैं। हालांकि, अंग्रेजी स्थानीयकरण का समर्थन कई देशों में विस्तारित किया गया है, भविष्य में और अधिक भाषाओं का समर्थन किया जाएगा, चीन और यूरोपीय संघ के उपयोगकर्ताओं के लिए अनिश्चितता हो सकती है।

【AiBase सारांश:】

🌟 Apple ने iOS18.2 आदि नए परीक्षण संस्करण जारी किए हैं, कई Apple Intelligence सुविधाएँ पेश की हैं।

🐱 नए API डेवलपर्स को जनरेटिव AI को अनुप्रयोगों में एकीकृत करने में मदद करेंगे।

🌍 विस्तारित अंग्रेजी स्थानीयकरण कई देशों में समर्थन, भविष्य में अधिक भाषाओं का समर्थन किया जाएगा।

11. Zoom ने AI सहायक 2.0 संस्करण जारी किया: मीटिंग के मुख्य बिंदुओं को आसानी से व्यवस्थित करें

Zoom ने हाल ही में AI सहायक 2.0 संस्करण लॉन्च किया है, जो उपयोगकर्ताओं को अधिक कुशल कार्य प्रबंधन और टीम सहयोग अनुभव प्रदान करता है। AI Companion 2.0 न केवल मीटिंग में तात्कालिक सहायता प्रदान कर सकता है, बल्कि ईमेल और चैट रिकॉर्ड को प्रबंधित कर सकता है, धन्यवाद पत्र लिख सकता है, आदि, कार्य दक्षता को समग्र रूप से बढ़ाता है। Zoom ने AI प्राथमिकता कार्य मंच की दिशा में एक महत्वपूर्ण कदम उठाया है, जो भुगतान करने वाले खातों वाले उपयोगकर्ताओं के लिए मुफ्त में उपलब्ध है।

image.png

【AiBase सारांश:】

✨ AI Companion 2.0 Zoom द्वारा नया AI सहायक है, जिसका उद्देश्य कार्य दक्षता को बढ़ाना है।

🤖 उपयोगकर्ता मीटिंग में प्रश्न पूछ सकते हैं और तात्कालिक सहायता प्राप्त कर सकते हैं, महत्वपूर्ण जानकारी को आसानी से पुनः देख सकते हैं।

📄 AI सहायक ईमेल और चैट रिकॉर्ड के प्रबंधन का समर्थन करता है, साथ ही धन्यवाद पत्र लिखने और परियोजना ड्राफ्ट उत्पन्न करने में भी सक्षम है।