अलीबाबा क्लाउड ने दुनिया के पहले पूर्ण मोडल AI मॉडल Qwen3-Omni लॉन्च किया, जो पाठ, चित्र, ध्वनि और वीडियो के एकीकृत प्रसंस्करण को संभालता है

AIbase基地

द्वारा प्रकाशितAI समाचार · 5 मिनट पढ़ें · Sep 23, 2025

अलीबेन ने Qwen3-Omni जारी किया, जो वैश्विक पहला एकल-से-एकल सभी माध्यम एआई मॉडल के उत्पादन की घोषणा करता है और अब इस मॉडल को ओपन सोर्स कर दिया गया है। Qwen3-Omni विभिन्न प्रकार के इनपुट के साथ काम करने की क्षमता रखता है, जैसे टेक्स्ट, छवि, ऑडियो और वीडियो, और टेक्स्ट या प्राकृतिक बोले गए शब्दों के माध्यम से वास्तविक समय में स्ट्रीमिंग आउटपुट के साथ तेजी से प्रतिक्रिया दे सकता है।

Qwen3-Omni मॉडल विभिन्न क्षेत्रों में अंतर-माध्यम प्रदर्शन में अग्रणी है। टेक्स्ट पर केंद्रित शुरुआती पूर्व-प्रशिक्षण और मिश्रित बहु-माध्यम प्रशिक्षण के माध्यम से, इस मॉडल में बहु-माध्यम क्षमता है। ऑडियो और वीडियो प्रदर्शन में इसकी क्षमता विशेष रूप से उत्कृष्ट है, जबकि टेक्स्ट और छवि पर प्रभाव भी उच्च मानक बनाए रखता है। 36 ऑडियो और वीडियो बेंचमार्क परीक्षणों के आधार पर, Qwen3-Omni 22 में नवीनतम अग्रणी स्थिति तक पहुंच गया है, विशेष रूप से स्वचालित बोली पहचान और ऑडियो समझ जैसे क्षेत्रों में, जहां यह उद्योग के समकक्ष Gemini2.5Pro के समान है।

Qwen3-Omni 119 टेक्स्ट भाषाओं और 19 ऑडियो इनपुट भाषाओं का समर्थन करता है, इसके अलावा 10 ऑडियो आउटपुट भाषाएं हैं, जैसे अंग्रेजी, चीनी, फ्रेंच और जर्मन। यह क्षमता इसे वैश्विक उपयोगकर्ताओं की बेहतर सेवा करने में सक्षम बनाती है। इसकी नवाचार वाली व्यवस्था MoE (एक्सपर्ट मिक्स) प्रणाली पर आधारित है, जिसमें AuT पूर्व-प्रशिक्षण शामिल है, जिससे मॉडल के सामान्य प्रतिनिधित्व क्षमता बढ़ जाती है। साथ ही, बहु-कोडबुक डिज़ाइन निम्न देरी वाले वास्तविक समय ऑडियो और वीडियो अंतरक्रिया को सुनिश्चित करता है और प्राकृतिक बातचीत के समान बहुत चलती है।

Qwen3-Omni के अलावा, अलीबेन ने Qwen3-TTS भी जारी किया, जो 17 ध्वनि विकल्पों के समर्थन के साथ टेक्स्ट-टू-स्पीच मॉडल है। इस मॉडल ने कई मूल्यांकन बेंचमार्क पर उत्कृष्ट प्रदर्शन किया, जो कई प्रतिद्वंद्वी मॉडलों के ऊपर गया, विशेष रूप से ध्वनि स्थिरता और ध्वनि समानता में विशेष रूप से उल्लेखनीय।

Qwen-Image-Edit-2509 एक अन्य जारी किए गए उपकरण है, जो छवि संपादन के बहु-छवि समर्थन पर केंद्रित है, जो संपादन की एकरूपता और प्रभाव को नाटकीय रूप से बढ़ाता है। यह एकल छवि के साथ काम करने में सक्षम है, साथ ही बहु-छवि जोड़कर संपादन के समर्थन के साथ अधिक जटिल संपादन आवश्यकताओं को पूरा कर सकता है।

GitHub:https://github.com/QwenLM/Qwen3-Omni
huggingface:https://huggingface.co/collections/Qwen/qwen3-omni-68d100a86cd0906843ceccbe

मुख्य बातें:
🌟 Qwen3-Omni विश्व का पहला एकल-से-एकल सभी माध्यम एआई मॉडल है, जो टेक्स्ट, छवि, ऑडियो और वीडियो के एकीकृत प्रबंधन के समर्थन के साथ आता है।
🌐 मॉडल 119 टेक्स्ट भाषाओं और 19 ऑडियो इनपुट के समर्थन के साथ आता है, जो वैश्विक उपयोगकर्ताओं की बहुभाषीय आवश्यकताओं को पूरा करता है।
🖼️ जारी किए गए Qwen-Image-Edit-2509 बहु-छवि संपादन के समर्थन के साथ आता है, जो संपादन की एकरूपता और प्रभाव को नाटकीय रूप से बढ़ाता है।

Qwen3-Omni AI मोडल मॉडल अलीबाबा क्लाउड ओपन सोर्स

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

राष्ट्र के पहला बकरी उद्योग क्षैतिज बड़ा मॉडल लॉन्च किया गया: सू वु मॉडल एआई से बकरी पालन में बुद्धिमान शक्ति प्रदान करता है

21वें भेड़ उद्योग विकास सम्मेलन में सु वू स्मार्ट शीप मॉडल V1.0 लॉन्च किया गया। यह पहला पूर्ण-श्रृंखला भेड़ उद्योग मॉडल है, जिसे क्यूवेन3 आर्किटेक्चर पर विकसित किया गया।....

Oct 6, 2025

अली Qwen-VL-30B-A3B नई मॉडल जारी करता है, गणित और वीडियो प्रसंस्करण क्षमता के रूप में मजबूत कहा जाता है

अलीबाबा ने दो 30 अरब पैरामीटर बहुमाध्यम मॉडल Qwen3-VL-30B-A3B जारी किए, जो GPT-5-Mini जैसे शीर्ष मॉडलों के समान हैं, गणित, चित्र पहचान, वीडियो प्रसंस्करण आदि क्षेत्रों में उत्कृष्ट प्रदर्शन दिखाते हैं, जो मजबूत प्रतिस्पर्धा दिखाते हैं।

Oct 6, 2025

मेटा की नीति में महत्वपूर्ण संशोधन: उपयोगकर्ता और एआई सहायक के बातचीत के आंकड़े पूरे प्लेटफॉर्म पर विज्ञापन और सामग्री प्रसारण के लिए उपयोग किए जाएंगे

मेटा ने 2025 के 16 दिसंबर से घोषणा की कि मेटा AI के साथ उपयोगकर्ताओं के सभी लिखित या ध्वनि बातचीत को अपने विज्ञापन और सामग्री एल्गोरिथ्म में एकीकृत कर लिया जाएगा। इसका मतलब है कि एआई चैट में उपयोगकर्ता के अंतरक्रिया के प्रभाव उनके फेसबुक, इंस्टाग्राम आदि प्लेटफॉर्म पर देखे जा रहे विज्ञापनों, पोस्टों और समूह सामग्री पर सीधे प्रभाव डालेगा। उदाहरण के लिए, पर्वतारोहण के बारे में बात करने के बाद, उपयोगकर्ता के डायनामिक में अधिक संबंधित विज्ञापन और सामग्री प्रस्तुत की जाएगी।

Oct 6, 2025

एंथ्रोपिक भाषा मॉडल सुरक्षा नेटवर्क के नए शक्तिशाली बल में परिणत हुए: क्लॉड 4.5 विवरण खोजने में वृद्धि हुई

एंथ्रोपिक कंपनी ने अपने बड़े भाषा मॉडल के नेटवर्क सुरक्षा के क्षेत्र में अपने अभियान के बारे में प्रदर्शित किया, नवीनतम क्लॉड सॉनेट 4.5 में सॉफ्टवेयर दोष की खोज के संभावना 5% है, जो पिछले सॉनेट 4 के 2% से बहुत बढ़ गई है। सीबरगम परीक्षण द्वारा AI के नेटवर्क रक्षा में दक्षता के साथ तकनीकी प्रगति के संभावित बल के रूप में प्रमाणित किया गया।

Oct 6, 2025

गणना के बाधा और गोपनीयता की समस्या: OpenAI के नए AI उपकरण जिसके लॉन्च को टाल दिया गया है

OpenAI और Jony Ive की LoveFrom ने AI हार्डवेयर बनाने के लिए साझेदारी की, जो Amazon Echo से आगे होगा।....

Oct 6, 2025

गूगल ने बड़ा ड्राइव लगाया! जेमिनी क्लाई एक कमांड से MCP में शामिल हो जाएं, विकासकर्ता छोड़ दें कॉन्फिगरेशन के दुख

गूगल ओपन सोर्स टूल जेमिनी क्लाई और फास्टएमसीपी फ्रेमवर्क के गहरे एकीकरण के साथ, एक आदेश के साथ ही MCP सर्वर के इंस्टॉल और कॉन्फिगरेशन को पूरा कर सकते हैं, जो लंबे समय से हाथ से कॉन्फिगर करने और डेपेंडेंसी के साथ-साथ ट्रांसमिशन चैनल के डीबगिंग के लिए आवश्यक जटिल विकास प्रक्रिया को बहुत कम कर देता है।

Oct 4, 2025

आईओएस 26 में डेवलपर कैसे एप्पल के स्थानीय एआई मॉडल का उपयोग कर सकते हैं

iOS 26 में फाउंडेशन मॉडल्स फ्रेमवर्क से डेवलपर्स बिना इंटरनेट के AI मॉडल्स का उपयोग कर सकते हैं। Lil Artist ऐप ने 'AI स्टोरीज' फीचर जोड़कर बच्चों के लिए कस्टम कहानियाँ बनाने की सुविधा दी।....

Oct 4, 2025

साल में तीन बार के फंडिंग से 50 बिलियन डॉलर तक पहुंचे! सुपाबेस एकाधिक ग्राहकों में सबसे अधिक जाना जाने वाला छात्र है

Supabase ने एक साल में 3.8 बिलियन डॉलर जुटाए, मूल्यांकन 5 गुना बढ़कर 5 बिलियन डॉलर हो गया। तेज़ फंडिंग और डेटाबेस सेवा में क्रांति लाने की रणनीति।....

Oct 4, 2025

गूगल जेमिनी 3.0 प्रो के टेस्टिंग वर्जन लीक हुए: प्रोग्रामिंग क्षमता में बड़ी छलांग अगले सप्ताह लॉन्च किया जाएगा

गूगल जेमिनी 3.0 प्रो जल्द ही लॉन्च किया जाएगा, टेस्टिंग वर्जन दर्शाता है कि इसकी प्रोग्रामिंग में बहुत उत्कृष्ट प्रदर्शन है। इस मॉडल में प्रो और फ्लैश दो मॉडल होते हैं, डेवलपर्स के टेस्टिंग परिणाम ध्यान आकर्षित कर रहे हैं, ओपनएआई सोरा 2 के बाद, एआई प्रतिस्पर्धा में एक और गर्मी जोड़ रहे हैं।

Oct 4, 2025

ओपनएआई के नए एप्लिकेशन सोरा के चार दिन में ऐप स्टोर पर शीर्ष स्थान हासिल कर लिया

ओपनएआई के वीडियो जनरेटिंग एप्लिकेशन सोरा के चार दिन में ऐप स्टोर के मुफ्त बिक्री रैंकिंग में शीर्ष स्थान हासिल कर लिया, गूगल जेमिनी और अपने चैटजीपीटी के ऊपर। इस एप्लिकेशन में उपयोगकर्ता छोटे वीडियो बनाने, संपादित करने और साझा करने के लिए समर्थन है। अब तक इसका परीक्षण केवल अमेरिका और कनाडा के आईओएस उपयोगकर्ताओं द्वारा आमंत्रित तरीके से किया गया है। बाजार की प्रतिक्रिया दर्शाती है कि AI वीडियो उपकरणों की मांग मजबूत है।

Oct 4, 2025

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

AIbase基地

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

अली Qwen-VL-30B-A3B नई मॉडल जारी करता है, गणित और वीडियो प्रसंस्करण क्षमता के रूप में मजबूत कहा जाता है

एंथ्रोपिक भाषा मॉडल सुरक्षा नेटवर्क के नए शक्तिशाली बल में परिणत हुए: क्लॉड 4.5 विवरण खोजने में वृद्धि हुई

गणना के बाधा और गोपनीयता की समस्या: OpenAI के नए AI उपकरण जिसके लॉन्च को टाल दिया गया है

गूगल ने बड़ा ड्राइव लगाया! जेमिनी क्लाई एक कमांड से MCP में शामिल हो जाएं, विकासकर्ता छोड़ दें कॉन्फिगरेशन के दुख

आईओएस 26 में डेवलपर कैसे एप्पल के स्थानीय एआई मॉडल का उपयोग कर सकते हैं

साल में तीन बार के फंडिंग से 50 बिलियन डॉलर तक पहुंचे! सुपाबेस एकाधिक ग्राहकों में सबसे अधिक जाना जाने वाला छात्र है

गूगल जेमिनी 3.0 प्रो के टेस्टिंग वर्जन लीक हुए: प्रोग्रामिंग क्षमता में बड़ी छलांग अगले सप्ताह लॉन्च किया जाएगा

ओपनएआई के नए एप्लिकेशन सोरा के चार दिन में ऐप स्टोर पर शीर्ष स्थान हासिल कर लिया

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

AIbase基地

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

अली Qwen-VL-30B-A3B नई मॉडल जारी करता है, गणित और वीडियो प्रसंस्करण क्षमता के रूप में मजबूत कहा जाता है

एंथ्रोपिक भाषा मॉडल सुरक्षा नेटवर्क के नए शक्तिशाली बल में परिणत हुए: क्लॉड 4.5 विवरण खोजने में वृद्धि हुई

गणना के बाधा और गोपनीयता की समस्या: OpenAI के नए AI उपकरण जिसके लॉन्च को टाल दिया गया है

गूगल ने बड़ा ड्राइव लगाया! जेमिनी क्लाई एक कमांड से MCP में शामिल हो जाएं, विकासकर्ता छोड़ दें कॉन्फिगरेशन के दुख

आईओएस 26 में डेवलपर कैसे एप्पल के स्थानीय एआई मॉडल का उपयोग कर सकते हैं

साल में तीन बार के फंडिंग से 50 बिलियन डॉलर तक पहुंचे! सुपाबेस एकाधिक ग्राहकों में सबसे अधिक जाना जाने वाला छात्र है

गूगल जेमिनी 3.0 प्रो के टेस्टिंग वर्जन लीक हुए: प्रोग्रामिंग क्षमता में बड़ी छलांग अगले सप्ताह लॉन्च किया जाएगा

ओपनएआई के नए एप्लिकेशन सोरा के चार दिन में ऐप स्टोर पर शीर्ष स्थान हासिल कर लिया

GEO Services