माइक्रोसॉफ्ट Azure AI ने MM-Vid लॉन्च किया: GPT-4V द्वारा लंबे वीडियो की व्याख्या, दृष्टिहीन लोगों के लिए नया अनुभव प्रदान करता है

站长之家

द्वारा प्रकाशितAI समाचार · 2 मिनट पढ़ें · Nov 15, 2023

माइक्रोसॉफ्ट Azure AI ने MM-Vid पेश किया, जो GPT-4V और विशेष उपकरणों को एकीकृत करता है, लंबे वीडियो की व्याख्या करता है और दृष्टिहीन लोगों के लिए बेहतर अनुभव प्रदान करता है। MM-Vid मल्टीमॉडल समझ, सतत कथानक और अन्य महत्वपूर्ण मॉड्यूल के माध्यम से वास्तविक दुनिया के वीडियो को व्यापक रूप से समझता है। प्रयोगों ने प्रश्न-उत्तर, व्यक्ति पहचान जैसे कार्यों में उत्कृष्ट प्रदर्शन साबित किया है, और यह निरंतर स्ट्रीमिंग वीडियो फ़्रेम इनपुट प्राप्त करने की क्षमता रखता है। यह नवाचार बड़े मल्टीमॉडल मॉडल के क्षेत्र में विकास को आगे बढ़ाने की उम्मीद है, वीडियो समझने के लिए एक मजबूत समाधान प्रदान करता है। GPT-4V का सफल एकीकरण सामान्य वीडियो समझने की जरूरतों और दृष्टिहीन लोगों के लिए...

आर्टिफिशियल इंटेलिजेंस GPT-4V मल्टीमॉडल मॉडल

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

360 दुनिया के पहले L2-L4 स्टैक बुद्धिमान प्लेटफॉर्म के लॉन्च के साथ! सरकारी और उद्यमी एआई बदलाव के ओपन-बॉक्स-इन-इस्तेमाल के युग में प्रवेश करते हैं

360 ग्रुप ने एंटरप्राइज AI प्लेटफॉर्म लॉन्च किया, जो L2 से L4 तक की क्षमताओं वाला दुनिया का पहला ऑपरेटिंग सिस्टम है। SEAF फैक्ट्री को अपग्रेड करके सरकार और व्यवसायों के लिए वन-स्टॉप AI समाधान प्रदान करता है।....

Oct 29, 2025

100

ओपनएआई के पुनर्गठन ने माइक्रोसॉफ्ट के बाजार पूंजीकरण को 4 ट्रिलियन डॉलर से अधिक कर दिया

ओपनएआई अनुल्लंघन से व्यापारिक भागीदारी की ओर बढ़ रहा है, तेजी से वृद्धि के लिए निवेश की खोज में एक रणनीति समायोजन ने इसकी बाजार प्रतिस्पर्धा में वृद्धि की और साथ ही माइक्रोसॉफ्ट के साथ भागीदारी के ऊपर गहरा प्रभाव डाला, जिसके कारण इसके बाजार पूंजीकरण चार ट्रिलियन डॉलर से ऊपर चला गया। चैटजीपीटी जैसी तकनीक के व्यापक उपयोग के कारण यह प्रमुख प्रेरक कारक रहा।

Oct 29, 2025

एडोब फायरफ्लाई इमेज 5 के भारी सुधार: 4 मेगापिक्सल मूल उत्पादन, एआई ध्वनि ट्रैक + कस्टम मॉडल निर्माता पूर्ण स्तरीय एआई निर्माण के युग में पहुंच गए

एडोब ने विशेषज्ञ स्तर के एआई छवि जनरेशन मॉडल फायरफ्लाई इमेज 5 जारी किया, जो 'पर्याप्त' से विशेषज्ञ स्तर के बदलाव को साकार करता है। नई सुविधाएं शामिल हैं: मूल 4 मेगापिक्सल आउटपुट, लेयर टिप्पणी संपादन, कस्टम कला शैली मॉडल और एआई ध्वनि ट्रैक जनरेशन, छवि, वीडियो, ध्वनि के एआई निर्माण के बंद सीक्वेंस को सुनिश्चित करते हुए, रचनात्मक कार्य प्रवाह के अनुकूलन के साथ नए सिरे से निर्धारित करते हैं।

Oct 29, 2025

100

एडोबी ने AI खुले युग की शुरुआत की: मुख्य एप्लिकेशन पूरी तरह से चैट असिस्टेंट और बाहरी मॉडल के साथ एम्बेड किए गए हैं, Firefly5.0 4K नैटिव छवि उत्पन्न कर सकता है!

एडोबी ने MAX में चैट-आधारित AI असिस्टेंट लॉन्च किया, जो Photoshop, Express और Firefly एप्लिकेशन में उपलब्ध है। उपयोगकर्ता चैट के माध्यम से रचनात्मक कार्यों को सौंप सकते हैं और चरण-दर-चरण दिशा निर्देश प्राप्त कर सकते हैं। साथ ही, गूगल, OpenAI आदि जैसे तीसरे पक्ष AI मॉडलों के समर्थन का विस्तार किया गया है, जो सामग्री निर्माण को खुली बुद्धिमता की ओर बढ़ाता है।

Oct 29, 2025

110

ओपनएआई जीपीटी-5 के मानसिक स्वास्थ्य प्रतिक्रिया में झटका सुधार, अनुचित उत्तर 65% कम हो गए

ओपनएआई ने जीपीटी-5 नया मॉडल जारी किया, जिसमें मानसिक स्वास्थ्य प्रतिक्रिया कार्यक्षेत्र में मुख्य सुधार किया गया। आंकड़ों के अनुसार, हर सप्ताह लगभग 0.15% सक्रिय उपयोगकर्ता (लगभग 1 मिलियन) बातचीत में आत्महत्या की इच्छा व्यक्त करते हैं। इसके लिए, ओपनएआई ने दुनिया के 60 देशों के 300 विशेषज्ञों के साथ मिलकर प्रतिक्रिया तंत्र को अपग्रेड किया, ताकि उपयोगकर्ताओं की गंभीर मांग के उत्तर दिया जा सके।

Oct 28, 2025

अध्ययन: गूगल सर्च के विपरीत, AI सर्च अक्सर कम प्रसिद्ध वेबसाइटों का उद्धरण देता है

जर्मन रूर विश्वविद्यालय और मैक्स प्लैंक संस्थान के अध्ययन में पाया गया कि पारंपरिक सर्च इंजन और जनरेटिव AI में जानकारी प्रस्तुत करने में अंतर बहुत अधिक होता है। अध्ययन गूगल प्राकृतिक सर्च और चार AI प्रणालियों (गूगल AI सारांश, Gemini2.5Flash, GPT-4o आदि) की तुलना करता है, 4600 से अधिक खोजों के माध्यम से राजनीति, तकनीक आदि छह क्षेत्रों में बनाए गए परीक्षणों द्वारा यह सामने आता है कि जानकारी के स्रोत और सामग्री के संगठन में उनके मूल अंतर होते हैं।

Oct 27, 2025

180

AI मॉडल दो पुस्तकों के उपयोग से प्रसिद्ध शैली के कार्य बनाता है जिसके कारण संपत्ति अधिकार कानून में नई चर्चा होती है

AI सिर्फ़ दो किताबों से लेखकों की शैली की नकल कर सकता है। 50 लेखकों पर शोध में, AI की रचनाएँ पाठकों को ज़्यादा पसंद आईं, यहाँ तक कि विशेषज्ञ भी हैरान रह गए।....

Oct 27, 2025

99.7% लागत अंतर! आईएआई लेखक के शैली की प्रतियोगिता अधिक पसंद करने वाले, अनुमानित उचित उपयोग सीमा का निर्देश लेखांकन विवाद के लिए फट गया

AI को कम डेटा से ट्यून करके प्रसिद्ध लेखकों की शैली में मनपसंद लेख बनाने में सफलता, जिससे कॉपीराइट मामलों पर असर पड़ रहा है।....

Oct 27, 2025

AI मॉडल अंकित व्यवहार के मॉडलिंग में नशे की लत के लक्षण दिखाते हैं

दक्षिण कोरिया के ग्वांग्जू टेक्नोलॉजी स्कूल के अध्ययन में पाया गया कि AI चैट बॉट (GPT-4o-mini, GPT-4.1-mini, Gemini-2.5-Flash, Claude-3.5-Haiku) जैसे मॉडल बैकरेट एक्सपेरिमेंट में शराबी प्रवृत्ति दिखाते हैं। मॉडल के पास शुरू में 100 डॉलर होता है, लेकिन वे बाहर नहीं जाने के बजाय लगातार बेट लगाते रहते हैं, जो उनके निर्णय योग्यता में जोखिम के खतरे को दर्शाता है।

Oct 27, 2025

120

AI दैनिक: टेंग्यून ने एक नई IMA2.0 जारी की; माइक्रोसॉफ्ट ने Copilot के साथ एक शक्तिशाली अपडेट जारी किया; अलीबाबा क्वार्क AI चश्मा डिलीवरी के लिए उपलब्ध है

【AI दैनिक】 चंद्रमा के अंधेरे ने Kimi k2 मॉडल के प्रदर्शन के लिए तारीफ मिली GPT-5 से आगे, और इस कंपनी ने अपने अगले नए खंड में सैकड़ों मिलियन डॉलर के निवेश के साथ करीब चार महीने में निवेश के बाद। घरेलू AI बड़े मॉडल क्षेत्र में लगातार गर्म है, डेवलपर्स प्लेटफॉर्म के माध्यम से नवीनतम उत्पाद अपडेट के बारे में जान सकते हैं।

Oct 24, 2025

180

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services

AI Model Compatibility Checker

AI Deployment Calculator

站长之家

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

ओपनएआई के पुनर्गठन ने माइक्रोसॉफ्ट के बाजार पूंजीकरण को 4 ट्रिलियन डॉलर से अधिक कर दिया

ओपनएआई जीपीटी-5 के मानसिक स्वास्थ्य प्रतिक्रिया में झटका सुधार, अनुचित उत्तर 65% कम हो गए

अध्ययन: गूगल सर्च के विपरीत, AI सर्च अक्सर कम प्रसिद्ध वेबसाइटों का उद्धरण देता है

AI मॉडल दो पुस्तकों के उपयोग से प्रसिद्ध शैली के कार्य बनाता है जिसके कारण संपत्ति अधिकार कानून में नई चर्चा होती है

AI मॉडल अंकित व्यवहार के मॉडलिंग में नशे की लत के लक्षण दिखाते हैं

संबंधित AI समाचार अनुशंसाएँ

ओपनएआई के पुनर्गठन ने माइक्रोसॉफ्ट के बाजार पूंजीकरण को 4 ट्रिलियन डॉलर से अधिक कर दिया

ओपनएआई जीपीटी-5 के मानसिक स्वास्थ्य प्रतिक्रिया में झटका सुधार, अनुचित उत्तर 65% कम हो गए

अध्ययन: गूगल सर्च के विपरीत, AI सर्च अक्सर कम प्रसिद्ध वेबसाइटों का उद्धरण देता है

AI मॉडल दो पुस्तकों के उपयोग से प्रसिद्ध शैली के कार्य बनाता है जिसके कारण संपत्ति अधिकार कानून में नई चर्चा होती है

AI मॉडल अंकित व्यवहार के मॉडलिंग में नशे की लत के लक्षण दिखाते हैं

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

站长之家

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

ओपनएआई के पुनर्गठन ने माइक्रोसॉफ्ट के बाजार पूंजीकरण को 4 ट्रिलियन डॉलर से अधिक कर दिया

ओपनएआई जीपीटी-5 के मानसिक स्वास्थ्य प्रतिक्रिया में झटका सुधार, अनुचित उत्तर 65% कम हो गए

अध्ययन: गूगल सर्च के विपरीत, AI सर्च अक्सर कम प्रसिद्ध वेबसाइटों का उद्धरण देता है

AI मॉडल अंकित व्यवहार के मॉडलिंग में नशे की लत के लक्षण दिखाते हैं

संबंधित AI समाचार अनुशंसाएँ

ओपनएआई के पुनर्गठन ने माइक्रोसॉफ्ट के बाजार पूंजीकरण को 4 ट्रिलियन डॉलर से अधिक कर दिया

ओपनएआई जीपीटी-5 के मानसिक स्वास्थ्य प्रतिक्रिया में झटका सुधार, अनुचित उत्तर 65% कम हो गए

अध्ययन: गूगल सर्च के विपरीत, AI सर्च अक्सर कम प्रसिद्ध वेबसाइटों का उद्धरण देता है

AI मॉडल अंकित व्यवहार के मॉडलिंग में नशे की लत के लक्षण दिखाते हैं

GEO Services