माइक्रोसॉफ्ट ने GPT-realtime मॉडल लॉन्च किया, जिसका फोकस अधिक वास्तविक ध्वनि और बहुमाध्यम प्रविष्टि पर है

AIbase基地

द्वारा प्रकाशितAI समाचार · 4 मिनट पढ़ें · Sep 5, 2025

माइक्रोसॉफ्ट ने आधिकारिक रूप से घोषणा की है कि उनका नया बोल-से-बोल (S2S) मॉडल GPT-realtime, Azure AI Foundry प्लेटफॉर्म पर आधिकारिक रूप से जारी कर दिया गया है। यह नया मॉडल विभिन्न सुधारों को एक एकीकृत उत्पाद में समाहित करता है जो माइक्रोसॉफ्ट के बोलने के तकनीकी क्षेत्र में है, जिसका मुख्य फायदा प्राकृतिक भाषा प्रसंस्करण, अद्भुत ध्वनि गुणवत्ता और अधिक सटीक निर्देश पालन क्षमता पर केंद्रित है।

माइक्रोसॉफ्ट

विकासकर्ता अब नए Real-time API के माध्यम से GPT-realtime तक पहुंच सकते हैं। यह मॉडल अधिक प्राकृतिक और व्यंजनात्मक बोलने के आउटपुट और बेहतर ध्वनि अनुभव प्रदान करने के लिए डिज़ाइन किया गया है। इस जारीकरण के हिस्से के रूप में, माइक्रोसॉफ्ट ने दो नए बोलने के विकल्प पेश किए - Marin और Cedar, जो उपयोगकर्ताओं के लिए वास्तविक और स्पष्ट बोलने के संश्लेषण प्रभाव प्रदान करने के लिए डिज़ाइन किए गए हैं।

माइक्रोसॉफ्ट के घोषणा में नए मॉडल के कुछ महत्वपूर्ण सुधारों पर जोर दिया गया है, जिसमें कार्य कॉल क्षमता में सुधार, अधिक उच्च सटीकता के साथ निर्देश के कार्यान्वयन और नवीनतम चित्र इनपुट समर्थन शामिल हैं। यह नई सुविधा उपयोगकर्ताओं को बोलचाल में चित्र जोड़ने और चर्चा करने की अनुमति देती है, जिससे बिना वीडियो स्ट्रीम के बहुमाध्यमी अंतरक्रिया की अनुमति मिलती है।

तकनीकी सुधारों के अलावा, माइक्रोसॉफ्ट ने मूल्य नीति में सुधार किया। पिछले gpt-4o-realtime पूर्वावलोकन संस्करण की तुलना में, आधिकारिक संस्करण gpt-realtime की कीमत 20% कम हो गई है, जो प्रति मिलियन टोकन (टोकन) के उपयोग पर आधारित होगी।

यह जारीकरण माइक्रोसॉफ्ट के विकासकर्ताओं और कंपनियों के लिए अपने वास्तविक समय के एआई क्षमता के विस्तार के लिए उनके प्रयासों को दर्शाता है। व्यंजनात्मक बोलने के संश्लेषण, उच्च गुणवत्ता ध्वनि और बहुमाध्यमी इनपुट के संयोजन के माध्यम से, GPT-realtime उन्नत ग्राहक समर्थन प्रणालियों से लेकर नवीनतम सहायता उपकरण तक व्यापक अनुप्रयोग स्थितियों के लिए शक्तिशाली तकनीकी समर्थन प्रदान करने के लिए अपेक्षित है।

एस2एस जीपीटी-रियलटाइम एज़्योरएआईफाउंड्री मैरिन

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

360 दुनिया के पहले L2-L4 स्टैक बुद्धिमान प्लेटफॉर्म के लॉन्च के साथ! सरकारी और उद्यमी एआई बदलाव के ओपन-बॉक्स-इन-इस्तेमाल के युग में प्रवेश करते हैं

360 ग्रुप ने एंटरप्राइज AI प्लेटफॉर्म लॉन्च किया, जो L2 से L4 तक की क्षमताओं वाला दुनिया का पहला ऑपरेटिंग सिस्टम है। SEAF फैक्ट्री को अपग्रेड करके सरकार और व्यवसायों के लिए वन-स्टॉप AI समाधान प्रदान करता है।....

Oct 29, 2025

मिनीमैक्स द्वारा M2 अनुमान बड़े मॉडल प्रस्तुत किया गया: 230 बिलियन पैरामीटर, 100 टोकन/सेकंड स्मार्ट एजेंट के लिए डिज़ाइन किया गया

MiniMax ने नया ओपन-सोर्स मॉडल M2 लॉन्च किया, जो 2300 अरब पैरामीटर्स के साथ स्मार्ट एजेंट के लिए डिज़ाइन किया गया है। यह प्रति सेकंड 100 टोकन की तेज़ गति से काम करता है, जो रीयल-टाइम इंटरेक्शन के लिए आदर्श है।....

Oct 28, 2025

110

मिनीमैक ओपन सोर्स M2 मॉडल: उच्च प्रदर्शन आईएआई कोडिंग और एजेंट सक्षम है, प्रतिद्वंद्वी के केवल 8% लागत

2025 के 27 अक्टूबर को, मिनीमैक बड़ा भाषा मॉडल मिनीमैक M2 ओपन सोर्स किया गया। इस मॉडल का डिज़ाइन एजेंट कार्य प्रवाह और एंड-टू-एंड कोडिंग के लिए किया गया है, MoE आर्किटेक्चर का उपयोग करता है, दक्षता और प्रदर्शन उत्कृष्ट है: क्लॉड सोनेट के केवल 8% लागत, गति लगभग दो गुना बढ़ गई, डेवलपर्स और व्यवसाय के लिए लाभदायक आईएआई समाधान है।

Oct 27, 2025

AI छवि संपादन में अभूतपूर्व प्रगति! बाइट डाउन और हांग कॉन्ग में एक साथ स्वतंत्र ड्रीमोम्नी2 AI अब अमूर्त अवधारणाओं के बुझाने की समस्या हल करता है

बाइटडांस ने हांगकांग की तीन यूनिवर्सिटी के साथ मिलकर DreamOmni2 सिस्टम ओपन-सोर्स किया। यह AI इमेज एडिटिंग में क्रांतिकारी सुधार लाता है, टेक्स्ट और इमेज दोनों को एक साथ प्रोसेस करता है, जिससे इमेज जनरेशन तकनीक का विकास हो रहा है।....

Oct 27, 2025

150

AI दैनिक: टेंग्यून ने एक नई IMA2.0 जारी की; माइक्रोसॉफ्ट ने Copilot के साथ एक शक्तिशाली अपडेट जारी किया; अलीबाबा क्वार्क AI चश्मा डिलीवरी के लिए उपलब्ध है

【AI दैनिक】 चंद्रमा के अंधेरे ने Kimi k2 मॉडल के प्रदर्शन के लिए तारीफ मिली GPT-5 से आगे, और इस कंपनी ने अपने अगले नए खंड में सैकड़ों मिलियन डॉलर के निवेश के साथ करीब चार महीने में निवेश के बाद। घरेलू AI बड़े मॉडल क्षेत्र में लगातार गर्म है, डेवलपर्स प्लेटफॉर्म के माध्यम से नवीनतम उत्पाद अपडेट के बारे में जान सकते हैं।

Oct 24, 2025

170

विडू क्यू2 रेफरेंस स्टूडियो मास प्लेटफॉर्म पूरी तरह से एपीआई के लिए खुला है

हाल ही में, स्टूडियो ने विडू क्यू2 रेफरेंस वीडियो बड़ा मॉडल एपीआई के पूर्ण रूप से एक्सेस के लिए घोषणा की, जो आईए वीडियो जनरेशन तकनीक के 'उपयोगी' से 'शिल्प' तक अहम कदम को दर्शाता है। विडू क्यू2 अत्यधिक संगतता बनाए रखने में अद्वितीय मूल्य दिखाता है, विशेष रूप से विज्ञापन, उत्पाद प्रदर्शन के क्षेत्रों में, न केवल उत्पाद विवरण को बिल्कुल बरकरार रख सकता है, बल्कि आईए वीडियो में भावनात्मक प्रस्तुति को भी जोड़ सकता है, जो ब्रांड के प्रति प्रतिकूलता और उपयोगकर्ता रूपांतरण को बढ़ा सकता है। विडू क्यू2 के उत्सर्ग ने इंटरैक्टिव मनोरंजन, एनिमेशन, विज्ञापन ई-कॉमर्स उद्योग के लिए एक नई दिशा दी है।

Oct 23, 2025

बैजियांग ने नवीनतम चिकित्सा मॉडल M2Plus पेश किया, जो चिकित्सा भ्रम दर में गंभीर रूप से कम हो गई है

बैजियांग मॉडल ने चिकित्सा मॉडल Baichuan-M2Plus लॉन्च किया, जिसके अपनाने के लिए बैजियांग छोटा एसएस का अपग्रेड किया गया है और API इंटरफ़ेस खोला गया है। परीक्षण में, इस मॉडल की चिकित्सा भ्रम दर आम मॉडल की तुलना में गंभीर रूप से कम है, जो DeepSeek की तुलना में लगभग तीन गुना कम है, अमेरिकी OpenEvidence एप्लिकेशन के मुकाबले बेहतर प्रदर्शन करता है।

Oct 22, 2025

150

एआई डेली: ओपनएआई ने ब्राउज़र एटलस जारी किया; टॉंगई क्वेन 3-वीएल में 2 बिलियन, 32 बिलियन मॉडल साइज जोड़े गए; बाइशुन ने पुनरावर्ती साक्ष्य बढ़ाने वाले बड़े मॉडल जारी किए

OpenAI ने ChatGPT Atlas ब्राउज़र लॉन्च किया, जो AI असिस्टेंट के साथ Chrome को चुनौती देता है। हर टैब में एजेंट मोड से स्मार्ट इंटरैक्शन, इंटरनेट प्लेटफॉर्म बनने की महत्वाकांक्षा दिखाता है।....

Oct 22, 2025

बेनचुआन ने संचालित साक्ष्य बढ़ाने वाले मॉडल M2Plus जारी किया, डॉक्टर के लिए चैटजीपीटी बनाएं

बाइचुआन ने Baichuan-M2Plus मेडिकल मॉडल लॉन्च किया, जिसमें मेडिकल हॉल्यूसिनेशन दर सामान्य मॉडल्स से काफी कम है। यह DeepSeek से 3 गुना बेहतर और OpenEvidence को पीछे छोड़ता है। नई तकनीक से मेडिकल प्रश्नों के जवाबों की सटीकता बढ़ी है।....

Oct 22, 2025

अली टोंगyi Qwen3-VL में 2B, 32B दो मॉडल आकार जोड़े गए हैं फोन में सुविधापूर्वक चलाया जा सकता है

अलीबाबा के टोंगई कियानवेन ने Qwen3-VL के 2B और 32B मॉडल जोड़े, जो हल्के से हाई-परफॉर्मेंस विज़न-लैंग्वेज कार्यों को कवर करते हैं और मोबाइल डिवाइस पर चल सकते हैं। इंस्ट्रक्ट मॉडल तेज़ और स्थिर है, जबकि थिंकिंग मॉडर तर्क पर केंद्रित है। विकास सुविधा और लचीलेपन में सुधार।....

Oct 22, 2025

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services

AI Model Compatibility Checker

AI Deployment Calculator

माइक्रोसॉफ्ट ने GPT-realtime मॉडल लॉन्च किया, जिसका फोकस अधिक वास्तविक ध्वनि और बहुमाध्यम प्रविष्टि पर है

AIbase基地

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

मिनीमैक ओपन सोर्स M2 मॉडल: उच्च प्रदर्शन आईएआई कोडिंग और एजेंट सक्षम है, प्रतिद्वंद्वी के केवल 8% लागत

विडू क्यू2 रेफरेंस स्टूडियो मास प्लेटफॉर्म पूरी तरह से एपीआई के लिए खुला है

बैजियांग ने नवीनतम चिकित्सा मॉडल M2Plus पेश किया, जो चिकित्सा भ्रम दर में गंभीर रूप से कम हो गई है

बेनचुआन ने संचालित साक्ष्य बढ़ाने वाले मॉडल M2Plus जारी किया, डॉक्टर के लिए चैटजीपीटी बनाएं

अली टोंगyi Qwen3-VL में 2B, 32B दो मॉडल आकार जोड़े गए हैं फोन में सुविधापूर्वक चलाया जा सकता है

संबंधित AI समाचार अनुशंसाएँ

मिनीमैक ओपन सोर्स M2 मॉडल: उच्च प्रदर्शन आईएआई कोडिंग और एजेंट सक्षम है, प्रतिद्वंद्वी के केवल 8% लागत

विडू क्यू2 रेफरेंस स्टूडियो मास प्लेटफॉर्म पूरी तरह से एपीआई के लिए खुला है

बैजियांग ने नवीनतम चिकित्सा मॉडल M2Plus पेश किया, जो चिकित्सा भ्रम दर में गंभीर रूप से कम हो गई है

बेनचुआन ने संचालित साक्ष्य बढ़ाने वाले मॉडल M2Plus जारी किया, डॉक्टर के लिए चैटजीपीटी बनाएं

अली टोंगyi Qwen3-VL में 2B, 32B दो मॉडल आकार जोड़े गए हैं फोन में सुविधापूर्वक चलाया जा सकता है

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

AI Brand Monitoring Tool

AI Search Visibility Checker

GEO Services​

AI Model Compatibility Checker

AI Deployment Calculator

माइक्रोसॉफ्ट ने GPT-realtime मॉडल लॉन्च किया, जिसका फोकस अधिक वास्तविक ध्वनि और बहुमाध्यम प्रविष्टि पर है

AIbase基地

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

मिनीमैक ओपन सोर्स M2 मॉडल: उच्च प्रदर्शन आईएआई कोडिंग और एजेंट सक्षम है, प्रतिद्वंद्वी के केवल 8% लागत

विडू क्यू2 रेफरेंस स्टूडियो मास प्लेटफॉर्म पूरी तरह से एपीआई के लिए खुला है

बैजियांग ने नवीनतम चिकित्सा मॉडल M2Plus पेश किया, जो चिकित्सा भ्रम दर में गंभीर रूप से कम हो गई है

बेनचुआन ने संचालित साक्ष्य बढ़ाने वाले मॉडल M2Plus जारी किया, डॉक्टर के लिए चैटजीपीटी बनाएं

अली टोंगyi Qwen3-VL में 2B, 32B दो मॉडल आकार जोड़े गए हैं फोन में सुविधापूर्वक चलाया जा सकता है

संबंधित AI समाचार अनुशंसाएँ

मिनीमैक ओपन सोर्स M2 मॉडल: उच्च प्रदर्शन आईएआई कोडिंग और एजेंट सक्षम है, प्रतिद्वंद्वी के केवल 8% लागत

विडू क्यू2 रेफरेंस स्टूडियो मास प्लेटफॉर्म पूरी तरह से एपीआई के लिए खुला है

बैजियांग ने नवीनतम चिकित्सा मॉडल M2Plus पेश किया, जो चिकित्सा भ्रम दर में गंभीर रूप से कम हो गई है

बेनचुआन ने संचालित साक्ष्य बढ़ाने वाले मॉडल M2Plus जारी किया, डॉक्टर के लिए चैटजीपीटी बनाएं

अली टोंगyi Qwen3-VL में 2B, 32B दो मॉडल आकार जोड़े गए हैं फोन में सुविधापूर्वक चलाया जा सकता है

GEO Services