सबसे मजबूत AI ध्वनि प्राप्त हुई! Eleven v3 Alpha संस्करण गॊथापित

AIbase基地

द्वारा प्रकाशितAI समाचार · 8 मिनट पढ़ें · Jun 6, 2025

एलेवन V3 (अल्फा संस्करण): नवीनतम पाठ से ध्वनि परिवर्तन मॉडल

मशीन सीखने के तकनीकी विकास के साथ-साथ, पाठ से ध्वनि (TTS) क्षेत्र एक नया पहलू लेने वाला है। 2025 के जून 5 को, एलेवनलैब्स ने अपना सबसे नवीन पाठ से ध्वनि मॉडल, एलेवन V3 (अल्फा संस्करण) आधिकारिक रूप से लॉन्च किया। इसे "पृथ्वी पर सबसे मजबूत" TTS मॉडल के रूप में दर्ज किया गया है। यह मॉडल पाठ को प्राकृतिक और प्रवाही ध्वनि में बदल सकता है, और सटीक भावना नियंत्रण और बहुभाषी समर्थन के माध्यम से वास्तविक बातचीत में भावनात्मक बदलाव और अवाक्शब्द व्यक्ति को प्रतिबिंबित कर सकता है, जिससे निर्माता और डेवलपर्स को अद्वितीय ध्वनि उत्पादन अनुभव प्रदान किया जाता है। यहाँ AIbase द्वारा एलेवन V3 अल्फा संस्करण पर विशेष रूप से व्याख्या की गई है।

विशिष्टता: न केवल बोलने, बल्कि 'नाटक' भी

एलेवन V3 अल्फा संस्करण का सबसे बड़ा उपयोग अपनी मजबूत भावना व्यक्ति क्षमता पर है। [laughs], [whispers], [sad], [excited] आदि ध्वनि लेबल्स के परिचालन द्वारा उपयोगकर्ता को ध्वनि की भावना, गति और ध्वनि प्रभावों जैसे [gunshot] या [explosion] को सटीक रूप से नियंत्रित करने की क्षमता प्रदान की गई है। ये लेबल्स सिर्फ साधारण गायन को नहीं बल्कि वास्तविक स्थितियों में भावनात्मक परिवर्तन और अवाक्शब्द व्यक्ति को समायोजित करते हैं, जिसे "नाटकीय संयोजन" कहा जाता है। उदाहरण के रूप में, बातचीत में [laughs] लेबल जोड़ने से मॉडल सच्ची हंसी बनाए रखता है, जो केवल "हाँ हाँ" जैसी टेक्स्ट स्थिति के स्थान पर नहीं है, जो ध्वनि की सच्चाई और डूबोंदारता में वृद्धि करता है।

इसके अलावा, एलेवन V3 70 से अधिक भाषाओं का समर्थन करता है, और बहु-भाषी बातचीत को नाटकीय रूप से प्रस्तुत कर सकता है। चाहे यह भाषाओं के बीच बदलाव, थाम का प्रबंधन हो या बातचीत में सोच और बंद करने का प्रतिनिधित्व करे, V3 नागरिक स्तर के प्राकृतिक और प्रवाही ध्वनि के साथ प्रदर्शन करता है। इस क्षमता के कारण इसे बहुभाषी सामग्री निर्माण, फिल्मी प्रोडक्शन, वर्चुअल एसिस्टेंट्स आदि क्षेत्रों में व्यापक उपयोगी होने का महत्व है।

तकनीकी अग्रयात: बेहतर पाठ समझ और बातचीत प्रतिनिधित्व

पिछली संस्करणों की तुलना में, एलेवन V3 अल्फा संस्करण ने पाठ समझने और बातचीत प्रतिनिधित्व में महत्वपूर्ण सुधार किया है। इसके उन्नत AI मॉडल के कारण, V3 उपयोगकर्ताओं को पाठ के अर्थ और प्रस्तावना को बेहतर ढंग से पकड़ने की क्षमता प्रदान करता है। चाहे यह कठिन भावनात्मक बातचीत हो या जोड़-नियंत्रित समझौता के गीत, V3 नागरिक और प्रवाही ताल और गति के साथ प्रस्तुत करता है, जो परंपरागत TTS मॉडलों की साधारण और एकाधिक स्तरीय प्रस्तुति से अधिक बेहतर है।

इसके अलावा, V3 में ऑटोमेटिक लेबलिंग फ़ंक्शन भी शामिल है। उपयोगकर्ता केवल "इम्प्रोव" बटन को क्लिक करके, मॉडल उसके पाठ के मुताबिक भावना लेबल्स जोड़ सकता है, जो प्रक्रिया को आसान बनाता है। इस बुद्धिमान डिज़ाइन के कारण, यदि उपयोगकर्ता को कोई विशेष ध्वनि संपादकीय अनुभव नहीं है, तो भी उच्च गुणवत्ता वाली ध्वनि सामग्री बना सकता है।

बहुमुखी अनुप्रयोग: सामग्री निर्माण से वर्चुअल एसिस्टेंट तक

एलेवन V3 अल्फा संस्करण के प्रकाशन ने सामग्री निर्माताओं को फायदा उठाने का रास्ता खोला है और व्यापारी स्तर के अनुप्रयोगों के लिए मजबूत समर्थन प्रदान किया है। उदाहरण के रूप में, फिल्म निर्माण में, V3 चरित्रों के लिए व्यक्तिगतीकृत डबिंग प्रदान कर सकता है; शिक्षा क्षेत्र में, यह पाठ्यपुस्तकों को बहुभाषी स्वरूप में बदल सकता है; और ग्राहक सेवा में, V3 की बातचीत AI कार्यक्षमता एक निरंतर डिजिटल दौरा बनाती है जो उपयोगकर्ताओं की आवश्यकताओं का प्रबंधन करती है।

विशेष रूप से, एलेवनलैब्स ने अपने आधिकारिक घोषणा में बताया है कि V3 अल्फा संस्करण 6 महीने के भीतर 80% की छूट प्रदान करेगा, जो इस तकनीकी परिवर्तन का प्रयोग करने के लिए उपयोगकर्ताओं को प्रोत्साहित करेगा। इस उपाय से इसकी वैश्विक प्रसार सुगमता बढ़ जाएगी।

उद्योग प्रभाव: AI ध्वनि के भविष्य को पुनर्निर्माण करना

एलेवनलैब्स को उत्कृष्ट ध्वनि सिंथेसिस और ध्वनि क्लोनिंग तकनीकों के लिए अग्रदूत के रूप में स्थापित किया गया है। V3 अल्फा संस्करण के प्रकाशन ने इसकी उद्योग में स्थिति को बनाया है। इसके साथ ही, बाजार में नारी लैब्स का Dia मॉडल जैसे खोलस्तरीय प्रतियोगी भी निकले हैं, जो TTS क्षेत्र में कठोर प्रतिस्पर्धा को प्रदर्शित करते हैं। हालांकि, एलेवन V3 के बहुभाषी समर्थन, भावना व्यक्ति क्षमता और सुविधाजनक ऑपरेशन अनुभव के साथ, यह प्रदर्शन और उपयोगकर्ता अनुभव में अग्रणी रहता है।

लंदन के AI क्रिएटिव स्टूडियो वंडर को मिला 3 मिलियन डॉलर का फंडिंग, ElevenLabs और OpenAI के प्रमुखों ने किया निवेश

लंदन स्थित AI क्रिएटिव स्टूडियो वंडर ने 3 मिलियन डॉलर का फंडिंग हासिल किया है। इस निवेश में ElevenLabs और OpenAI के प्रमुखों ने भी हिस्सा लिया है।

ElevenLabs ने MCP सर्वर लॉन्च किया: AI वॉयस क्षमताओं का स्मार्ट असिस्टेंट में सहज एकीकरण

ElevenLabs ने एक नया MCP सर्वर लॉन्च किया है जो डेवलपर्स को अपने स्मार्ट असिस्टेंट में AI-पावर्ड वॉयस क्षमताओं को आसानी से एकीकृत करने की अनुमति देता है। यह एक सहज और कुशल एकीकरण प्रदान करता है, जिससे उपयोगकर्ता अनुभव को बेहतर बनाया जा सकता है।

ElevenLabs ने Scribe वॉयस-टू-टेक्स्ट मॉडल जारी किया, जिसकी सटीकता अभूतपूर्व है और अंग्रेज़ी में 96.7% तक पहुँच गई है

ElevenLabs ने हाल ही में अपना नया Scribe वॉयस-टू-टेक्स्ट मॉडल जारी किया है, जो अंग्रेज़ी भाषा में 96.7% की अभूतपूर्व सटीकता प्राप्त करता है। यह मॉडल उन्नत तकनीक का उपयोग करके बनाया गया है, जिससे यह अन्य वॉयस-टू-टेक्स्ट मॉडलों से बेहतर प्रदर्शन करता है।

इलेवन लैब्स ने सभी लेखकों के लिए AI ऑडियोबुक प्रकाशन योजना खोली, Audible को चुनौती

TechCrunch की रिपोर्ट के अनुसार, वॉयस AI कंपनी ElevenLabs ने लेखकों को अपने रीडर ऐप पर AI-जनरेटेड ऑडियोबुक प्रकाशित करने की अनुमति दे दी है, इससे पहले कंपनी ने Spotify के साथ AI नेरेशन ऑडियोबुक लॉन्च किया था। ElevenLabs ने पिछले महीने $180 मिलियन का भारी फंडिंग हासिल किया था, और पिछले साल से लेखकों को प्रकाशन योजना के लिए आमंत्रित कर रहा था, अब यह योजना सभी लेखकों के लिए खुली है। कंपनी का लक्ष्य किफायती और आसान ऑडियोबुक निर्माण उपकरण प्रदान करना है ताकि उत्पादन लागत कम हो और Audible को चुनौती दी जा सके।

Spotify और ElevenLabs ने AI सुनाई गई पुस्तक विकल्प को पेश किया

गुरुवार को, Spotify ने ElevenLabs के साथ सहयोग की घोषणा की, और आधिकारिक तौर पर उस कंपनी की AI आवाज़ प्रौद्योगिकी के साथ सुनाई गई पुस्तकों के उपयोग को स्वीकार करने लगा। वर्तमान में सबसे मान्यता प्राप्त AI ऑडियो प्रदाताओं में से एक के रूप में, यह नई साझेदारी स्पष्ट रूप से प्लेटफ़ॉर्म पर AI सुनाई गई पुस्तकों की संख्या में उल्लेखनीय वृद्धि की उम्मीद करती है। नए प्रक्रिया के अनुसार, लेखकों को पहले ElevenLabs से ऑडियो फ़ाइल पैकेज डाउनलोड करना होगा, फिर Spotify की सुनाई गई पुस्तक वितरण सेवा Findaway Voices का उपयोग करना होगा।