AI डेली: वान 2.2-एस2वी मॉडल जल्द जारी किया जाएगा; बाइट डेंग तीन आयामी मॉडल जनरेटर के परीक्षण में है; माइक्रोसॉफ्ट ओपन सोर्स VibeVoice-1.5B मॉडल

【AI दैनिक】 विभाग में आपका स्वागत है! यह आपके दैनिक कृत्रिम बुद्धिमत्ता दुनिया की खोज का निर्देश है, हम प्रतिदिन आपके लिए AI क्षेत्र के गर्म विषय प्रस्तुत करते हैं, डेवलपर्स पर केंद्रित होते हैं, ताकि आप तकनीकी प्रवृत्ति के बारे में जान सकें और नवीनतम AI उत्पाद अनुप्रयोगों के बारे में जान सकें।

ताजा AI उत्पाद क्लिक करें :https://app.aibase.com/zh

1. अली टोंगई वैन एक्सएमएक्सएमएक्स-एसटीवी मॉडल के बारे में घोषणा: AI वीडियो और ध्वनि सिंक्रनाइज़ेशन को खोलें

अली टोंगई वैन एक्सएमएक्सएमएक्स ने सोशल मीडिया प्लेटफॉर्म X पर अपने नए AI मॉडल वैन 2.2-S2V के बारे में घोषणा की, जो वीडियो और ध्वनि के साथ-साथ बना सकता है, वीडियो और ध्वनि के गहरे एकीकरण को संभव बनाता है। यह बहुमाध्यमी AI उत्पादन तकनीक में महत्वपूर्ण प्रगति का संकेत है, जो सामग्री निर्माताओं के लिए अधिक कुशल और अधिक व्यंजनात्मक उपकरण प्रदान करता है।

【AiBase सारांश:】
🔥 वैन2.2-S2V मॉडल वीडियो और ध्वनि के साथ-साथ बनाने की क्षमता रखता है, पारंपरिक वीडियो उत्पादन मॉडल की सीमाओं को तोड़ता है।
🎵 मॉडल गाना ध्वनि वाले AI वीडियो बना सकता है, बहुमाध्यमी AI उत्पादन तकनीक के नवाचार को दर्शाता है।
🚀 यह मॉडल AI वीडियो उत्पादन क्षेत्र के मानक को पुनः परिभाषित कर सकता है, अंतर्निहित और वास्तविकता से भरे सामग्री उत्पादन के विकास को बढ़ावा देता है।

2. बिट टूक आंतरिक परीक्षण नई 3D मॉडल जनरेटर उपकरण "3D Model Generator"

बिट टूक के अंतर्गत डू बाओ टीम एक नई 3D मॉडल जनरेटर उपकरण "3D Model Generator" के विकास में लगी हुई है, जो उपयोगकर्ताओं को नियंत्रित बड़े पैमाने पर जनरेशन मॉडल की क्षमता प्रदान करने के लिए डिज़ाइन किया गया है। इस उपकरण में छवि आधारित जनरेशन और छवि और मॉडल फाइल के संयोजन के साथ जनरेशन के तरीके समर्थित हैं, 3D मॉडलिंग के प्रवेश के बारे में कम बाधाएं डालते हैं, विशेष रूप से गेम विकास क्षेत्र में महत्वपूर्ण है।

【AiBase सारांश:】
🖼️ छवि आधारित 3D मॉडल जनरेशन के समर्थन के साथ, 3D मॉडलिंग के प्रवेश के बारे में कम बाधाएं डालता है।
⚙️ छवि और मॉडल फाइल के संयोजन के साथ जनरेशन के तरीके प्रदान करता है, रचनात्मक स्वतंत्रता बढ़ाता है।
🚀 अपेक्षित खुला होगा, डू बाओ के कार्यक्षमता को बढ़ाएगा, अधिक उपयोगकर्ता आवश्यकताओं की सेवा करेगा।

3. मोबाइल फोन भी चलाएगा! मिनीसीपीएम-वी4.5: 4.1 बिलियन पैरामीटर GPT-4.1-mini के ऊपर करता है

मिनीसीपीएम-वी4.5, बेईजी इंटेलिजेंस और ताइजिंग विश्वविद्यालय के NLP प्रयोगशाला के साथ संयुक्त रूप से लॉन्च किया गया, एक एंड-साइड बहुमाध्यमी बड़ा मॉडल है, जिसकी बहुत अच्छी क्षमता है और उच्च दक्षता के साथ नियंत्रित किया जा सकता है। इस मॉडल ने कई मानक परीक्षण में अच्छा प्रदर्शन किया, बहुभाषी, वीडियो और उच्च विवरण छवि प्रसंस्करण का समर्थन करता है, एज उपकरणों के लिए उपयोगी है, AI तकनीक के विस्तार को बढ़ावा देता है।

【AiBase सारांश:】
🌟 मिनीसीपीएम-वी4.5 4.1 बिलियन पैरामीटर के साथ उच्च प्रदर्शन करता है, GPT-4.1-mini आदि मॉडल के ऊपर जाता है।
🖼️ बहु-छवि, वीडियो समझ और उच्च विवरण छवि प्रसंस्करण का समर्थन करता है, OCR क्षमता मुख्य मॉडल के आगे है।
📱 एज उपकरणों पर उच्च दक्षता के साथ नियंत्रित किया जा सकता है, मोबाइल और ऑफलाइन स्थिति के लिए उपयुक्त है, विकास के लिए नीचे के बाधाएं कम करता है।
विवरण लिंक: https://huggingface.co/openbmb/MiniCPM-V-4_5

4. एप्पल ने AI शिक्षण नई विधि लॉन्च की: कार्य सूची के बजाय मानव मूल्यांकन के माध्यम से मॉडल प्रदर्शन में वृद्धि करें

एप्पल के अनुसंधान टीम ने एक नई शिक्षण विधि जिसे बुकलेट आधारित सुधार लर्निंग (RLCF) कहा जाता है, के प्रस्ताव के साथ एक नई शिक्षण विधि प्रस्तुत की, जो अनुक्रमिक कार्य सूची के बजाय पारंपरिक मानव लाइक मूल्यांकन तंत्र के स्थान पर उपयोग करता है, बड़े भाषा मॉडल के जटिल निर्देशों के कार्यान्वयन में महत्वपूर्ण वृद्धि करता है। इस विधि का बहुत अच्छा प्रदर्शन कई मूल्यांकन मानकों में हुआ, विशेष रूप से जटिल बहु-चरण कार्यों के साथ बहुत अच्छा प्रदर्शन किया।

【AiBase सारांश:】
🍎 RLCF विधि कार्य सूची के बजाय मानव मूल्यांकन के साथ मॉडल के जटिल निर्देशों के कार्यान्वयन क्षमता में वृद्धि करती है।
📊 FollowBench, InFoBench आदि परीक्षण में, प्रदर्शन में महत्वपूर्ण वृद्धि हुई, अधिकतम 8.2% तक।
⚙️ बड़े मॉडल के उत्पादन बुकलेट के साथ, छोटे मॉडल के लिए अनुकूलन निर्देश प्रदान करता है, लेकिन मजबूत गणना संसाधनों के समर्थन की आवश्यकता होती है।

5. माइक्रोसॉफ्ट VibeVoice-1.5B मॉडल खुला करता है: 90 मिनट की अत्यधिक लंबी ध्वनि संश्लेषण में नई उपलब्धि

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

Building and Deploying AI

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

站长之家

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

अपेक्षा से अधिक प्रदर्शन! एलीबाबा क्लाउड 26% वृद्धि के साथ AI आय में नंबर एक, लगातार 8 तिमाही में तीन अंकों की वृद्धि

बिलियनेर डैन लॉब ने टाइवीसी के शेयर कम कर दिए, एक अन्य ट्रिलियन आर्टिफिशियल इंटेलिजेंस कंपनी में निवेश किया

बीडू सर्च एआई सहायक पूर्ण रूप से तेज मॉडल लॉन्च करता है सर्च परिणाम उत्पादन गति में बढ़ोतरी

नेटीएम्यूज़िक ने AI सुझाव वाला म्यूज़िक फीचर लॉन्च किया, आसानी से अपनी व्यक्तिगत संगीत सूची बनाएं

नोटबुक एलएम वीडियो अवलोकन में 80 से अधिक भाषाओं का समर्थन जोड़ा गया है, चीनी का समर्थन शामिल है

मस्क के एआई प्रोग्रामिंग साधन जीरोक कोड फास्ट 1 नि:शुल्क खोला गया 92 गुना गति द्वारा सभी को पछाड़ देता है