सिलिकॉन बेस्ड फ्लो प्लेटफॉर्म में अली Qwen3-VL मॉडल लॉन्च करता है, दृश्य ज्ञान क्षमता को सुधारता है

AIbase基地

द्वारा प्रकाशितAI समाचार · 6 मिनट पढ़ें · Oct 13, 2025

हाल ही में, सिलिकॉन बेस्ड फ्लो प्लेटफॉर्म ने अली के नए जारी किए गए Qwen3-VL श्रृंखला ओपन-सोर्स मॉडल को लॉन्च किया। इस श्रृंखला के मॉडल में दृश्य अवधारणा, समय विश्लेषण और बहु-माध्यम तर्क में महत्वपूर्ण प्रगति हुई है। छवि अस्पष्टता, वीडियो की जटिलता, आदि जैसी चुनौतियों के लिए, Qwen3-VL दृश्य ज्ञान क्षमता को प्रभावी ढंग से बढ़ा सकता है, जिससे उपयोगकर्ता जटिल दृश्य सूचना के प्रबंधन में आसानी से काम कर सकते हैं।

Qwen3-VL श्रृंखला मॉडल के मुख्य विशेषताओं में से एक उत्कृष्ट छवि पहचान क्षमता है, 32 भाषाओं के OCR के लिए समर्थन प्रदान करता है, जो कम प्रकाश, अस्पष्ट, झुके हुए पाठ के साथ सटीक रूप से निपट सकता है। साथ ही, यह मॉडल बहुत मजबूत छवि-लेखन समझ क्षमता भी है, शब्द आधारित मॉडल के साथ तुलना में, इसकी लेखन समझ में अपनाया गया है, जो गहरे छवि-लेखन संयोजन को संभव बनाता है।

वीडियो समझ में, Qwen3-VL श्रृंखला मूल रूप से 256K के संदर्भ प्रक्रमण समर्थन करता है, जो अधिकतम 1M तक विस्तारित किया जा सकता है, जिसका अर्थ है कि यह घंटों तक के वीडियो सामग्री के साथ निपट सकता है। सेकंड दर सेकंड सूचीबद्ध करने और सटीक वापसी के माध्यम से, Qwen3-VL वीडियो में महत्वपूर्ण घटनाओं की स्थिति को सुलभ रूप से निर्धारित कर सकता है और समयचिह्न संरेखण क्षमता रखता है, जिससे वीडियो सामग्री के विश्लेषण की दक्षता बढ़ जाती है।

इसके अलावा, Qwen3-VL बुद्धिमान व्यवहार में भी अच्छा प्रदर्शन करता है, जो सीधे पीसी या मोबाइल उपकरण के इंटरफेस से बातचीत कर सकता है, इंटरफेस तत्वों की पहचान कर सकता है, टूल्स का उपयोग कर सकता है और विभिन्न कार्य कर सकता है। इसकी दृश्य प्रोग्रामिंग क्षमता छवि के आधार पर उपयोगी सामग्री जैसे Draw.io चार्ट, HTML, CSS, JS आदि बनाने में सक्षम है, जो STEM और गणितीय तर्क जैसे कठिन कार्यों में अग्रणी प्रदर्शन दिखाता है।

अतिरिक्त रूप से, अंतर्निहित बहु-आयामी घूर्णन स्थिति कोडिंग और गहरे स्टैक्ड एकीकरण तकनीक के आविष्कार के माध्यम से, Qwen3-VL मॉडल लंबे वीडियो तर्क और छवि विशेषता अंकन में अद्वितीय प्रदर्शन करता है, जो दृश्य कार्य के निपटान क्षमता को बहुत बढ़ा देता है। मुख्य दृश्य अनुभव मूल्यांकन में, Qwen3-VL श्रृंखला मॉडल अन्य बंद-सोर्स मॉडल के मुकाबले बहुत अधिक प्रदर्शन करता है, जो इसकी मजबूत व्यापक क्षमता और समग्र प्रदर्शन को दर्शाता है।

सिलिकॉन बेस्ड फ्लो प्लेटफॉर्म विकासकर्ताओं को एक स्थान पर बड़े मॉडल सेवाएं प्रदान करता है, जिसमें विभिन्न उत्कृष्ट मॉडल शामिल हैं, जो भाषा, छवि, ध्वनि आदि के विभिन्न कार्य स्थितियों का समर्थन करते हैं। नए उपयोगकर्ता प्लेटफॉर्म के माध्यम से अनुभव उपहार प्राप्त कर सकते हैं और मॉडल की मजबूत क्षमता का सुलभ रूप से अनुभव कर सकते हैं।

मुख्य बिंदु:
🌟 Qwen3-VL श्रृंखला मॉडल 32 भाषाओं के OCR का समर्थन करता है और छवि और वीडियो समझ क्षमता के साथ अद्वितीय है।
🎥 घंटों तक के वीडियो सामग्री के साथ समर्थन मूल रूप से संभव है, जो सेकंड दर सेकंड सूचीबद्ध कर सकता है और महत्वपूर्ण घटनाओं के सटीक वापसी कर सकता है।
🖥️ बुद्धिमान व्यवहार क्षमता मजबूत है, जो इंटरफेस से बातचीत कर सकता है और विभिन्न कार्य कर सकता है, जो उत्पादकता में सुधार करता है।

Qwen3-VL सिलिकॉन बेस्ड फ्लो प्लेटफॉर्म ओपन सोर्स मॉडल दृश्य समझ

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

अत्यधिक कम देरी! कार्टेसिया ने सोनिक-3 वॉइस एआई इंजन पेश किया: अद्वितीय मानवीय बातचीत देरी 100 मिलीसेकंड से कम

कार्टेसिया कंपनी ने वॉइस एआई इंजन सोनिक-3 पेश किया, जिसे विश्व के सबसे तेज और स्वाभाविक वास्तविक समय बातचीत मॉडल कहा जाता है। यह एक नई स्थिति स्पेस मॉडल आर्किटेक्चर के माध्यम से लगभग शून्य देरी वाले अंतरक्रिया को साकार करता है, मानवीय भाव, टोन और हंसी के परिवर्तन का अनुकरण कर सकता है, जो बातचीत की वास्तविकता में बहुत बढ़ोतरी करता है।

Oct 29, 2025

ओपनएआई जीपीटी-5 के मानसिक स्वास्थ्य प्रतिक्रिया में झटका सुधार, अनुचित उत्तर 65% कम हो गए

ओपनएआई ने जीपीटी-5 नया मॉडल जारी किया, जिसमें मानसिक स्वास्थ्य प्रतिक्रिया कार्यक्षेत्र में मुख्य सुधार किया गया। आंकड़ों के अनुसार, हर सप्ताह लगभग 0.15% सक्रिय उपयोगकर्ता (लगभग 1 मिलियन) बातचीत में आत्महत्या की इच्छा व्यक्त करते हैं। इसके लिए, ओपनएआई ने दुनिया के 60 देशों के 300 विशेषज्ञों के साथ मिलकर प्रतिक्रिया तंत्र को अपग्रेड किया, ताकि उपयोगकर्ताओं की गंभीर मांग के उत्तर दिया जा सके।

Oct 28, 2025

अनुसंधान बताता है कि बहुत सारे अकारण डेटा बड़े भाषा मॉडल के तर्क क्षमता को प्रभावित करते हैं

नए शोध के अनुसार, बड़े भाषा मॉडल का निरर्थक ऑनलाइन सामग्री के संपर्क में रहना उनके प्रदर्शन, तर्क क्षमता और आत्मविश्वास को कमजोर कर सकता है। अमेरिकी शोधकर्ताओं ने इसे 'एलएलएम मस्तिष्क ह्रास परिकल्पना' नाम दिया है।....

Oct 27, 2025

130

अली Qwen डीप रिसर्च पेश करता है: एक क्लिक पर रिपोर्ट, वेबसाइट और पॉडकास्ट बनाएं

अलीबाबा ने Qwen Deep Research अपग्रेड किया। Qwen Chat में अब एक क्लिक में शोध रिपोर्ट, इंटरैक्टिव वेबपेज और पॉडकास्ट बनाए जा सकते हैं। डेटा विश्लेषण से कंटेंट निर्माण तक का पूरा चक्र सिर्फ 1-2 क्लिक में पूरा।....

Oct 23, 2025

120

बिट ट्वीटर सीड टीम ने 3D जनरेशन बड़ा मॉडल सीड 3D 1.0 लॉन्च करने की घोषणा की

बिट ट्वीटर सीड टीम हाल ही में 3D जनरेशन बड़ा मॉडल सीड3डी1.0 लॉन्च करने की घोषणा की, जो एकल तस्वीर से एंड-टू-एंड उच्च गुणवत्ता वाले सिमुलेशन स्तर के 3D मॉडल बनाने में सक्षम है, जिसमें विस्तृत ज्यामिति, वास्तविक टेक्स्चर और भौतिक रेंडरिंग (PBR) मटेरियल शामिल हैं। यह अभिनव परिणाम शारीरिक बुद्धिमत्ता के विकास के लिए एक मजबूत दुनिया संमिश्रण समर्थन प्रदान करने में सक्षम हो सकता है, जो वर्तमान प्रौद्योगिकी में भौतिक अंतरक्रिया क्षमता और सामग्री विविधता के मुद्दों के समाधान में मदद कर सकता है। विकास के दौरान, सीड टीम ने बड़े पैमाने पर उच्च गुणवत्ता वाले 3D डेटा का संग्रह किया और पूर्ण तीन के निर्माण के लिए संसाधित किया।

Oct 23, 2025

साइबरकैब अगले द्वितीय चतुर्थांश में उत्पादन के लिए: ऑप्टिमस V3 अगले साल प्रस्तुत किया जाएगा, मास्क ने AI और रोबोट्स पर बेट लगाई

टेस्ला की Q3 2025 में आय $280.95B (11.57% वृद्धि), लेकिन शुद्ध लाभ $13.73B (36.81% गिरावट)। मस्क ने AI और रोबोटिक्स पर ध्यान केंद्रित करने की घोषणा की।....

Oct 23, 2025

हाइलुओ 2.3 आने वाला है: वीओ के पार एक नई पीढ़ी का एआई वीडियो मॉडल, जीवंतता फिर से बढ़ाई गई

MiniMax का Hailuo2.3 वीडियो जनरेशन मॉडल लॉन्च होगा, जो यथार्थवाद, सटीकता और शैली विविधता में क्रांतिकारी सुधार लाता है। यह AI वीडियो जनरेशन में एक बड़ी छलांग माना जा रहा है।....

Oct 23, 2025

110

अली सी योजना के पहले प्रदर्शन: क्वार्क डायलॉग असिस्टेंट लॉन्च, Qwen मॉडल के साथ C-सीमा AI प्रवेश के लिए प्रतिस्पर्धा करें

अलीबाबा ने 'प्रोजेक्ट सी' के तहत क्वार्क ऐप डायलॉग असिस्टेंट लॉन्च किया, जो तोंगयी कियानवेन मॉडल पर आधारित है। यह युवा उपयोगकर्ताओं के लिए एआई एंट्री पॉइंट और अली के इकोसिस्टम को मजबूत करेगा। होमपेज पर क्लिक/स्वाइप कर इस्तेमाल करें।....

Oct 23, 2025

मिश्रित दुनिया मॉडल 1.1 आधिकारिक रूप से जारी किया गया: 3D पुनर्निर्माण तकनीक में विप्लव उच्च गुणवत्ता वाले स्थानों का सेकंड में उत्पादन

टेंसेंट ने मिक्सवर्ल्ड मॉडल 1.1 ओपन-सोर्स किया, जो मल्टी-व्यू और वीडियो इनपुट को सपोर्ट करता है। यह सिंगल-कार्ड डिप्लॉयमेंट और तेज जनरेशन सक्षम करता है, सेकंडों में वीडियो/इमेज से प्रोफेशनल 3D सीन बनाता है, जिससे 3D रीकंस्ट्रक्शन टेक्नोलॉजी आम उपयोगकर्ताओं के लिए सुलभ हो गई है।....

Oct 22, 2025

100

एआई डेली: ओपनएआई ने ब्राउज़र एटलस जारी किया; टॉंगई क्वेन 3-वीएल में 2 बिलियन, 32 बिलियन मॉडल साइज जोड़े गए; बाइशुन ने पुनरावर्ती साक्ष्य बढ़ाने वाले बड़े मॉडल जारी किए

OpenAI ने ChatGPT Atlas ब्राउज़र लॉन्च किया, जो AI असिस्टेंट के साथ Chrome को चुनौती देता है। हर टैब में एजेंट मोड से स्मार्ट इंटरैक्शन, इंटरनेट प्लेटफॉर्म बनने की महत्वाकांक्षा दिखाता है।....

Oct 22, 2025

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Brand Visibility

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

सिलिकॉन बेस्ड फ्लो प्लेटफॉर्म में अली Qwen3-VL मॉडल लॉन्च करता है, दृश्य ज्ञान क्षमता को सुधारता है

AIbase基地

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

अत्यधिक कम देरी! कार्टेसिया ने सोनिक-3 वॉइस एआई इंजन पेश किया: अद्वितीय मानवीय बातचीत देरी 100 मिलीसेकंड से कम

ओपनएआई जीपीटी-5 के मानसिक स्वास्थ्य प्रतिक्रिया में झटका सुधार, अनुचित उत्तर 65% कम हो गए

अनुसंधान बताता है कि बहुत सारे अकारण डेटा बड़े भाषा मॉडल के तर्क क्षमता को प्रभावित करते हैं

अली Qwen डीप रिसर्च पेश करता है: एक क्लिक पर रिपोर्ट, वेबसाइट और पॉडकास्ट बनाएं

बिट ट्वीटर सीड टीम ने 3D जनरेशन बड़ा मॉडल सीड 3D 1.0 लॉन्च करने की घोषणा की

हाइलुओ 2.3 आने वाला है: वीओ के पार एक नई पीढ़ी का एआई वीडियो मॉडल, जीवंतता फिर से बढ़ाई गई

संबंधित AI समाचार अनुशंसाएँ

अत्यधिक कम देरी! कार्टेसिया ने सोनिक-3 वॉइस एआई इंजन पेश किया: अद्वितीय मानवीय बातचीत देरी 100 मिलीसेकंड से कम

ओपनएआई जीपीटी-5 के मानसिक स्वास्थ्य प्रतिक्रिया में झटका सुधार, अनुचित उत्तर 65% कम हो गए

अनुसंधान बताता है कि बहुत सारे अकारण डेटा बड़े भाषा मॉडल के तर्क क्षमता को प्रभावित करते हैं

अली Qwen डीप रिसर्च पेश करता है: एक क्लिक पर रिपोर्ट, वेबसाइट और पॉडकास्ट बनाएं

बिट ट्वीटर सीड टीम ने 3D जनरेशन बड़ा मॉडल सीड 3D 1.0 लॉन्च करने की घोषणा की

हाइलुओ 2.3 आने वाला है: वीओ के पार एक नई पीढ़ी का एआई वीडियो मॉडल, जीवंतता फिर से बढ़ाई गई

GEO Services