एआई दैनिक समाचार अंक में आपका स्वागत है! यहां आप हर दिन कृत्रिम बुद्धिमत्ता की दुनिया के खोज के लिए एक निर्देश है, हम हर दिन आपके लिए एआई क्षेत्र में लोकप्रिय सामग्री प्रस्तुत करते हैं, डेवलपर्स पर केंद्रित हैं, जिससे आप तकनीकी प्रवृत्ति के बारे में जान सकते हैं और नवीनतम एआई उत्पाद अनुप्रयोगों के बारे में जान सकते हैं।
ताजा एआई उत्पाद जांचें :https://app.aibase.com/zh
1. किलिंग एआई नई डिजिटल मनुष्य कार्यक्षमता लॉन्च करता है: एक छवि से 1 मिनट का ऊंचा रिजॉल्यूशन वीडियो बनाएं
किलिंग एआई द्वारा पेश किए गए डिजिटल मनुष्य कार्यक्षमता ने स्थैतिक छवि से गतिशील वीडियो तक के अपनाने में अभियान किया है, आपको केवल भूमिका छवि और लेखन या ध्वनि इनपुट प्रदान करना होगा, फिर आप तेजी से उच्च गुणवत्ता वाला वीडियो बना सकते हैं। यह तकनीक बहु-माध्यम समझ और वीडियो उत्पादन मॉडल पर आधारित है, विभिन्न भूमिका बनाने और विभिन्न भाषाओं के समर्थन के साथ, सामग्री रचना, शिक्षा और व्यापार प्रचार के लिए नए संभावनाओं की पेशकश करता है।
【AiBase सारांश:】
📷 किलिंग एआई ने डिजिटल मनुष्य कार्यक्षमता लॉन्च की, स्थैतिक छवि से गतिशील वीडियो में बदलाव करती है।
🎙️ विभिन्न भाषाओं के समर्थन के साथ, जैसे कि चीनी, अंग्रेजी, जापानी, कोरियाई आदि।
💡 वीडियो निर्माण के प्रवेश बाधा कम करें, आम उपयोगकर्ता भी विशेषज्ञ स्तर के डिजिटल मनुष्य वीडियो बनाने में सक्षम हो सकते हैं।
विस्तृत लिंक:https://klingavatar.github.io/
2. टेंसेंट हंग्यून नई तकनीक बड़े मॉडल "ओइल करे", एआई द्वारा उत्पादित छवि अधिक वास्तविक हो जाए!
टेंसेंट हंग्यून टीम ने हांगकांग चाइनीज यूनिवर्सिटी (शेन्ज़ेन) और ताइज़ी विश्वविद्यालय के साथ सहयोग किया, SRPO तकनीक पेश की, जिसका उद्देश्य AI द्वारा उत्पादित छवि की वास्तविकता में सुधार करना है, Flux मॉडल में मानव त्वचा की गुणवत्ता के समस्या को सुलझाना। इस तकनीक में "अर्थ सापेक्ष पसंदीदा अनुकूलन" रणनीति का उपयोग किया गया है, और Direct-Align रणनीति का उपयोग उत्पादन पथ के अनुकूलन के लिए किया गया है, जिससे छवि गुणवत्ता और प्रशिक्षण की दक्षता में उल्लेखनीय सुधार हुआ है।
【AiBase सारांश:】
🧪 "अर्थ सापेक्ष पसंदीदा अनुकूलन" रणनीति को शामिल किया गया है, जो पुनर्बलन मॉडल के विचलन को न्यून करने के लिए सकारात्मक और ऋणात्मक शब्दों के संकेत के माध्यम से निर्देशित करता है।
📈 Direct-Align रणनीति का उपयोग किया गया है, नियंत्रित शोर डाला गया है और इसे रीकंस्ट्रक्शन के लिए रेफरेंस एंकर पॉइंट के रूप में उपयोग किया गया है, जिससे रीकंस्ट्रक्शन त्रुटि में उल्लेखनीय कमी हुई है।
⚡ SRPO तकनीक की प्रशिक्षण की दक्षता बहुत अधिक है, केवल 10 मिनट में वर्तमान विधि से आगे बढ़ सकता है, वास्तविकता और सौंदर्य रेटिंग में 3 गुना से अधिक सुधार हुआ है।
विस्तृत लिंक:https://tencent.github.io/srpo-project-page/
3. IBM ने Granite-Docling-258M जारी किया: ओपन सोर्स एंटरप्राइज डॉक्यूमेंट एआई मॉडल
IBM द्वारा पेश किए गए Granite-Docling-258M एक ओपन सोर्स विजुअल लैंग्वेज मॉडल है, जो पूर्ण प्रक्रिया डॉक्यूमेंट रूपांतरण पर केंद्रित है। यह डॉक्यूमेंट की बिन्दु जानकारी को बरकरार रख सकता है, टेबल, कोड, सूत्र आदि तत्वों को निकाल सकता है और संरचित मशीन पठनीय रूप में निर्यात कर सकता है, जो पारंपरिक OCR तकनीक से निश्चित रूप से बेहतर है।
【AiBase सारांश:】
🌟 नया मॉडल Granite-Docling-258M डॉक्यूमेंट रूपांतरण सटीकता में सुधार करने और बिन्दु जानकारी बरकरार रखने के लिए डिज़ाइन किया गया है।
🔧 उन्नत तकनीकी व्यवस्था का उपयोग किया गया है, जो पूर्ववर्ती संस्करण SmolDocling के बराबर अनुभव में बेहतर प्रदर्शन करता है।
🌍 विभिन्न भाषाओं के समर्थन के साथ नए अनुप्रयोग और लचीलापन बढ़ाया गया है।
विस्तृत लिंक:https://huggingface.co/collections/ibm-granite/granite-docling-682b8c766a565487bcb3ca00
4. मेटा ने पहला स्क्रीन वाला AI चश्मा Ray-Ban जारी किया: हाथ में ले जाएं बुद्धिमान सहायक
मेटा ने पहला स्क्रीन वाला AI चश्मा Ray-Ban जारी किया, जो अधिक सुविधाजनक बुद्धिमान अनुभव प्रदान करने के लिए डिज़ाइन किया गया है, और न्यूरो वॉच के साथ बुद्धिमान नियंत्रण के लिए जुड़ा हुआ है, जिससे मोबाइल उपकरणों पर निर्भरता कम हो जाती है।
【AiBase सारांश:】
📱 दाहिने लेंस में एम्बेडेड स्क्रीन है, जो एप्लिकेशन, याद दिलाने और नेविगेशन सूचना प्रदर्शित कर सकता है।
🧠 न्यूरो वॉच के साथ जुड़ा हुआ, मांसपेशी इलेक्ट्रोग्राम तकनीक के माध्यम से बुद्धिमान नियंत्रण के साथ काम करता है।
🌐 क्लाउड से जुड़े, आप चश्मा पर मेटा के अंतर्गत एप्लिकेशन का उपयोग कर सकते हैं और रास्ता और वास्तविक समय अनुवाद देख सकते हैं।