【AI दैनिक】 विभाग में आपका स्वागत है! यह आपके दैनिक कृत्रिम बुद्धिमत्ता दुनिया की खोज का निर्देश है, हम प्रतिदिन आपके लिए AI क्षेत्र के गर्म विषय प्रस्तुत करते हैं, डेवलपर्स पर केंद्रित होते हैं, ताकि आप तकनीकी प्रवृत्ति के बारे में जान सकें और नवीनतम AI उत्पाद अनुप्रयोगों के बारे में जान सकें।
ताजा AI उत्पाद क्लिक करें :https://app.aibase.com/zh
1. अली टोंगई वैन एक्सएमएक्सएमएक्स-एसटीवी मॉडल के बारे में घोषणा: AI वीडियो और ध्वनि सिंक्रनाइज़ेशन को खोलें
अली टोंगई वैन एक्सएमएक्सएमएक्स ने सोशल मीडिया प्लेटफॉर्म X पर अपने नए AI मॉडल वैन 2.2-S2V के बारे में घोषणा की, जो वीडियो और ध्वनि के साथ-साथ बना सकता है, वीडियो और ध्वनि के गहरे एकीकरण को संभव बनाता है। यह बहुमाध्यमी AI उत्पादन तकनीक में महत्वपूर्ण प्रगति का संकेत है, जो सामग्री निर्माताओं के लिए अधिक कुशल और अधिक व्यंजनात्मक उपकरण प्रदान करता है।
【AiBase सारांश:】
🔥 वैन2.2-S2V मॉडल वीडियो और ध्वनि के साथ-साथ बनाने की क्षमता रखता है, पारंपरिक वीडियो उत्पादन मॉडल की सीमाओं को तोड़ता है।
🎵 मॉडल गाना ध्वनि वाले AI वीडियो बना सकता है, बहुमाध्यमी AI उत्पादन तकनीक के नवाचार को दर्शाता है।
🚀 यह मॉडल AI वीडियो उत्पादन क्षेत्र के मानक को पुनः परिभाषित कर सकता है, अंतर्निहित और वास्तविकता से भरे सामग्री उत्पादन के विकास को बढ़ावा देता है।
2. बिट टूक आंतरिक परीक्षण नई 3D मॉडल जनरेटर उपकरण "3D Model Generator"
बिट टूक के अंतर्गत डू बाओ टीम एक नई 3D मॉडल जनरेटर उपकरण "3D Model Generator" के विकास में लगी हुई है, जो उपयोगकर्ताओं को नियंत्रित बड़े पैमाने पर जनरेशन मॉडल की क्षमता प्रदान करने के लिए डिज़ाइन किया गया है। इस उपकरण में छवि आधारित जनरेशन और छवि और मॉडल फाइल के संयोजन के साथ जनरेशन के तरीके समर्थित हैं, 3D मॉडलिंग के प्रवेश के बारे में कम बाधाएं डालते हैं, विशेष रूप से गेम विकास क्षेत्र में महत्वपूर्ण है।
【AiBase सारांश:】
🖼️ छवि आधारित 3D मॉडल जनरेशन के समर्थन के साथ, 3D मॉडलिंग के प्रवेश के बारे में कम बाधाएं डालता है।
⚙️ छवि और मॉडल फाइल के संयोजन के साथ जनरेशन के तरीके प्रदान करता है, रचनात्मक स्वतंत्रता बढ़ाता है।
🚀 अपेक्षित खुला होगा, डू बाओ के कार्यक्षमता को बढ़ाएगा, अधिक उपयोगकर्ता आवश्यकताओं की सेवा करेगा।
3. मोबाइल फोन भी चलाएगा! मिनीसीपीएम-वी4.5: 4.1 बिलियन पैरामीटर GPT-4.1-mini के ऊपर करता है
मिनीसीपीएम-वी4.5, बेईजी इंटेलिजेंस और ताइजिंग विश्वविद्यालय के NLP प्रयोगशाला के साथ संयुक्त रूप से लॉन्च किया गया, एक एंड-साइड बहुमाध्यमी बड़ा मॉडल है, जिसकी बहुत अच्छी क्षमता है और उच्च दक्षता के साथ नियंत्रित किया जा सकता है। इस मॉडल ने कई मानक परीक्षण में अच्छा प्रदर्शन किया, बहुभाषी, वीडियो और उच्च विवरण छवि प्रसंस्करण का समर्थन करता है, एज उपकरणों के लिए उपयोगी है, AI तकनीक के विस्तार को बढ़ावा देता है।
【AiBase सारांश:】
🌟 मिनीसीपीएम-वी4.5 4.1 बिलियन पैरामीटर के साथ उच्च प्रदर्शन करता है, GPT-4.1-mini आदि मॉडल के ऊपर जाता है।
🖼️ बहु-छवि, वीडियो समझ और उच्च विवरण छवि प्रसंस्करण का समर्थन करता है, OCR क्षमता मुख्य मॉडल के आगे है।
📱 एज उपकरणों पर उच्च दक्षता के साथ नियंत्रित किया जा सकता है, मोबाइल और ऑफलाइन स्थिति के लिए उपयुक्त है, विकास के लिए नीचे के बाधाएं कम करता है।
विवरण लिंक: https://huggingface.co/openbmb/MiniCPM-V-4_5
4. एप्पल ने AI शिक्षण नई विधि लॉन्च की: कार्य सूची के बजाय मानव मूल्यांकन के माध्यम से मॉडल प्रदर्शन में वृद्धि करें
एप्पल के अनुसंधान टीम ने एक नई शिक्षण विधि जिसे बुकलेट आधारित सुधार लर्निंग (RLCF) कहा जाता है, के प्रस्ताव के साथ एक नई शिक्षण विधि प्रस्तुत की, जो अनुक्रमिक कार्य सूची के बजाय पारंपरिक मानव लाइक मूल्यांकन तंत्र के स्थान पर उपयोग करता है, बड़े भाषा मॉडल के जटिल निर्देशों के कार्यान्वयन में महत्वपूर्ण वृद्धि करता है। इस विधि का बहुत अच्छा प्रदर्शन कई मूल्यांकन मानकों में हुआ, विशेष रूप से जटिल बहु-चरण कार्यों के साथ बहुत अच्छा प्रदर्शन किया।
【AiBase सारांश:】
🍎 RLCF विधि कार्य सूची के बजाय मानव मूल्यांकन के साथ मॉडल के जटिल निर्देशों के कार्यान्वयन क्षमता में वृद्धि करती है।
📊 FollowBench, InFoBench आदि परीक्षण में, प्रदर्शन में महत्वपूर्ण वृद्धि हुई, अधिकतम 8.2% तक।
⚙️ बड़े मॉडल के उत्पादन बुकलेट के साथ, छोटे मॉडल के लिए अनुकूलन निर्देश प्रदान करता है, लेकिन मजबूत गणना संसाधनों के समर्थन की आवश्यकता होती है।
5. माइक्रोसॉफ्ट VibeVoice-1.5B मॉडल खुला करता है: 90 मिनट की अत्यधिक लंबी ध्वनि संश्लेषण में नई उपलब्धि