एआईबेस एक संचार के लिए स्वागत है 【AI दैनिक】 विभाग!
हर दिन तीन मिनट में आज के AI प्रमुख घटना के बारे में जानें , आपको AI उद्योग के प्रवृत्ति, अभिनव AI उत्पाद अनुप्रयोग के बारे में समझ में आएगा।
अधिक AI समाचार देखें:https://www.aibase.com/zh
1. टेंसेंट ने हल्के मिश्रित Yuan-A13B मॉडल खुला किया, एक बेसिक GPU कार्ड पर इसके चलाने के लिए पर्याप्त है
टेंसेंट ने अपने मॉडल परिवार Yuan में नए सदस्य Yuan-A13B मॉडल जारी किया, जो एक एक्सपर्ट मिश्रण (MoE) संरचना का उपयोग करता है, कुल 80 बिलियन पैरामीटर तक पहुंच गया, एक्टिवेशन पैरामीटर 13 बिलियन है, जो बहुत अधिक डेटा प्रसंस्करण देरी और गणना खर्च कम करता है, निजी विकासकर्ता और छोटे व्यवसाय के लिए अधिक लाभदायक AI समाधान प्रदान करता है। यह मॉडल गणित, विज्ञान और तार्किक तर्क वाले कार्य में अच्छा प्रदर्शन करता है, जटिल आदेशों के उत्तर बनाने के लिए उपकरणों को कॉल करने के समर्थन के साथ।
अनुभव के प्रवेश: https://hunyuan.tencent.com/
ओपन सोर्स पता: https://github.com/Tencent-Hunyuan।
2. केलिंग AI "वीडियो ऑडियो इफेक्ट" कार्यक्षमता पेश करता है, "देखें जैसे कि सुनें" डूबे हुए अनुभव प्राप्त करें
केलिंग AI पूर्ण श्रृंखला वीडियो मॉडल में "वीडियो ऑडियो इफेक्ट" कार्यक्षमता शामिल है, जब उपयोगकर्ता वीडियो बनाता है, तो वह समान रूप से त्रि-आयामी ऑडियो इफेक्ट बना सकता है, "देखें जैसे कि सुनें" प्राप्त करें। अपग्रेड किए गए "ऑडियो इफेक्ट बनाने" कार्यक्षमता में "वीडियो से ऑडियो बनाने" मॉड्यूल जोड़ा गया है, जो अपने विकसित बहुमाध्यमी वीडियो ऑडियो बनाने मॉडल Kling-Foley के आधार पर ऑडियो और छवि फ्रेम स्तर पर संगति प्राप्त करता है। इस कार्यक्षमता को सभी उपयोगकर्ताओं के लिए सीमित समय तक मुफ्त खोल दिया गया है।
3. Black Forest ने FLUX.1Kontext [dev] के साथ चौंकाने वाला ओपन सोर्स किया, GPT-4o के बराबर छवि संपादन
Black Forest Labs ने छवि संपादन मॉडल FLUX.1Kontext [dev] ओपन सोर्स किया, जो 1.2 बिलियन पैरामीटर के एक धारा मैचिंग ट्रांसफॉर्मर आर्किटेक्चर के आधार पर है, जो उपभोक्ता स्तर के हार्डवेयर पर चल सकता है। इसका मुख्य कार्य संदर्भ जागरूकता और सटीक संपादन है, जो पाठ और छवि इनपुट को समझ सकता है, वास्तविक संदर्भ उत्पादन और संपादन कर सकता है, बार-बार संपादन के समर्थन के साथ।
ओपन सोर्स पता: https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev
Github: https://github.com/black-forest-labs/flux。
4. OpenAI ने Deep Research API नए मॉडल जारी किया: o3/o4-mini-deep research
OpenAI ने दो नए Deep Research API मॉडल o3-deep-research और o4-mini-deep-research जारी किए, जो उच्च स्तर के विश्लेषण और गहरे सूचना संश्लेषण के लिए डिज़ाइन किए गए हैं, जो स्वचालित वेबसाइट खोज, डेटा विश्लेषण, कोड निष्पादन आदि के समर्थन के साथ हैं। मूल्य निर्धारण के मामले में, o3 मॉडल के 1000 बार उपयोग के लिए कीमत 10 से 40 डॉलर के बीच है, o4-mini कीमत कम है, 2 से 8 डॉलर तक।
5. 1999 रुपये से शुरू! Xiaomi AI चश्मा बदल देता है स्मार्ट वार्डरोब, फिल्मांकन, भुगतान, संगीत एक ही चश्मा पूरा करता है!
Xiaomi ने अपना पहला आर्टिफिशियल इंटेलिजेंस वार्डरोब उत्पाद Xiaomi AI चश्मा जारी किया, जिसमें पहले व्यक्ति फिल्मांकन, वॉइस असिस्टेंट और खुले कान के कार्य हैं, बिजली बदलने वाले तकनीक के माध्यम से उपयोगकर्ताओं के लिए व्यक्तिगत अनुभव प्रदान करता है। चश्मा हल्का डिज़ाइन किया गया है, जिसका वजन केवल 40 ग्राम है, 12 मेगापिक्सल फ्रंट कैमरा शामिल है, 2K30 फ्रेम प्रति सेकंड वीडियो रिकॉर्डिंग और लाइव स्ट्रीमिंग सुविधा के साथ।
6. एक क्लिक पर बॉलीवुड वीडियो बनाएं! HeyGen AI वीडियो एजेंट कंटेंट बनाने में व्यापक रूप से व्याप्त है!
HeyGen ने AI वीडियो एजेंट पेश किया, जो सरल सामग्री अपलोड करके, वीडियो बनाने की पूरी प्रक्रिया को बनाने, पटकथा लेखन और फ्रेम चयन करने तक पूरा करता है, कुछ मिनट में प्रकाशित करने के लिए तैयार व्यावसायिक गुणवत्ता वाले वीडियो सामग्री प्राप्त करता है। विभिन्न प्रकार के वीडियो के समर्थन के साथ, अपनाने की प्रक्रिया सरल है, कोई विशेष वीडियो संपादन कौशल की आवश्यकता नहीं है, स्वचालित सुझाव आपको सामग्री अपलोड करने और रचनात्मक आवश्यकताएं निर्धारित करने में सहायता करता है, AI पूरी प्रक्रिया को पटकथा से फिल्म तक पूरा करता है।
7. महत्वपूर्ण! Google ने Gemma3n बहुमाध्यमी मॉडल ओपन सोर्स किया, मोबाइल फोन भी बाजार के बराबर AI क्षमता चलाता है