माइक्रोसॉफ्ट ने आधिकारिक रूप से घोषणा की है कि उनका नया बोल-से-बोल (S2S) मॉडल GPT-realtime, Azure AI Foundry प्लेटफॉर्म पर आधिकारिक रूप से जारी कर दिया गया है। यह नया मॉडल विभिन्न सुधारों को एक एकीकृत उत्पाद में समाहित करता है जो माइक्रोसॉफ्ट के बोलने के तकनीकी क्षेत्र में है, जिसका मुख्य फायदा प्राकृतिक भाषा प्रसंस्करण, अद्भुत ध्वनि गुणवत्ता और अधिक सटीक निर्देश पालन क्षमता पर केंद्रित है।

विकासकर्ता अब नए Real-time API के माध्यम से GPT-realtime तक पहुंच सकते हैं। यह मॉडल अधिक प्राकृतिक और व्यंजनात्मक बोलने के आउटपुट और बेहतर ध्वनि अनुभव प्रदान करने के लिए डिज़ाइन किया गया है। इस जारीकरण के हिस्से के रूप में, माइक्रोसॉफ्ट ने दो नए बोलने के विकल्प पेश किए - Marin और Cedar, जो उपयोगकर्ताओं के लिए वास्तविक और स्पष्ट बोलने के संश्लेषण प्रभाव प्रदान करने के लिए डिज़ाइन किए गए हैं।
माइक्रोसॉफ्ट के घोषणा में नए मॉडल के कुछ महत्वपूर्ण सुधारों पर जोर दिया गया है, जिसमें कार्य कॉल क्षमता में सुधार, अधिक उच्च सटीकता के साथ निर्देश के कार्यान्वयन और नवीनतम चित्र इनपुट समर्थन शामिल हैं। यह नई सुविधा उपयोगकर्ताओं को बोलचाल में चित्र जोड़ने और चर्चा करने की अनुमति देती है, जिससे बिना वीडियो स्ट्रीम के बहुमाध्यमी अंतरक्रिया की अनुमति मिलती है।
तकनीकी सुधारों के अलावा, माइक्रोसॉफ्ट ने मूल्य नीति में सुधार किया। पिछले gpt-4o-realtime पूर्वावलोकन संस्करण की तुलना में, आधिकारिक संस्करण gpt-realtime की कीमत 20% कम हो गई है, जो प्रति मिलियन टोकन (टोकन) के उपयोग पर आधारित होगी।
यह जारीकरण माइक्रोसॉफ्ट के विकासकर्ताओं और कंपनियों के लिए अपने वास्तविक समय के एआई क्षमता के विस्तार के लिए उनके प्रयासों को दर्शाता है। व्यंजनात्मक बोलने के संश्लेषण, उच्च गुणवत्ता ध्वनि और बहुमाध्यमी इनपुट के संयोजन के माध्यम से, GPT-realtime उन्नत ग्राहक समर्थन प्रणालियों से लेकर नवीनतम सहायता उपकरण तक व्यापक अनुप्रयोग स्थितियों के लिए शक्तिशाली तकनीकी समर्थन प्रदान करने के लिए अपेक्षित है।






