एलेवनलैब्स ने V3 स्वर मॉडल जारी किया: 70 से अधिक भाषाओं का समर्थन करता है, भावना और टोन को लेबल के माध्यम से नियंत्रित किया जा सकता है

AIbase基地

द्वारा प्रकाशितAI समाचार · 8 मिनट पढ़ें · Jun 6, 2025

वैश्विक प्रमुख AI आवाज़ प्रौद्योगिकी कंपनी ElevenLabs ने अपने सबसे ह récents पाठ से आवाज़ मॉडल Eleven v3 (अल्फा संस्करण) का आधिकारिक रिलीज़ किया, जिसे अब तक के सबसे प्रभावशाली AI आवाज़ मॉडल के रूप में पहचाना गया है। इस ब्रेकथ्रू ने आवाज़ संश्लेषण के प्राकृतिकता और भावनात्मक व्यक्तित्व को सुधारा है, और कंटेंट निर्माताओं और डेवलपर्स को और शक्तिशाली टूल्स प्रदान किए हैं, जो वीडियो, ऑडियो किताबें और मल्टीमीडिया टूल के विकास में मदद करते हैं।

तकनीकी विकास: और प्राकृतिक बातचीत और भावनात्मक व्यक्तित्व

Eleven v3 ने एक नया आर्किटेक्चर लागू किया है, जो पाठ अर्थ को और गहरा समझ पाए है, आवाज़ के प्रदर्शन को बढ़ावा देता है। पिछले मॉडल की तुलना में, v3 70 से अधिक भाषाओं का समर्थन करता है और बहु-भाषिक बातचीत स्थितियों का प्रबंधन करता है, जो वास्तविक बातचीत में भावनाओं के परिवर्तन, आवाज़ के उतार-चढ़ाव और अंतर को सिमुलेट करता है। नए आवाज़ लेबल फ़ंक्शन के माध्यम से, उपयोगकर्ता [sad], [angry], [whispers] या [laughs] जैसे लेबल्स का उपयोग करके, आवाज़ के भावनात्मक व्यक्तित्व और गैर-भाषिक प्रतिक्रियाओं को नियंत्रित कर सकते हैं, जैसे हंसी या साँस लेना। इस विशेष रूप से बार-बार के नियंत्रण ने निर्माताओं को अपने शानदार लेखों, ऑडियो किताबों के निर्माण और खेलों के आवाज़ डिज़ाइन में अत्यधिक त्याग प्रदान किया है।

उपयोग की स्थितियां: निर्माताओं और डेवलपर्स की सेवा

ElevenLabs ने v3 मॉडल को कंटेंट निर्माताओं और मीडिया टूल्स डेवलपर्स के लिए विशेष रूप से डिज़ाइन किया है। चाहे यह रोमांचक वीडियो नौकरियां, भावनापूर्ण ऑडियो किताबें बनाए रखना हो या इंटरैक्टिव मीडिया टूल विकसित करना हो, v3 की उच्च प्रदर्शन क्षमता उपयोगकर्ताओं का अनुभव सुधारेगी। इसके अलावा, मॉडल 32 से अधिक बोलने वालों को पहचानने और अलग करने में सक्षम है, जो बहुत से बातचीत स्थितियों के लिए शक्तिशाली समर्थन प्रदान करता है। इससे v3 को शिक्षा, मनोरंजन और व्यापारिक अनुप्रयोगों (जैसे AI कस्टमर केंद्र) में व्यापक अनुप्रयोग के लिए तैयार किया जा सकता है।

पब्लिक टेस्टिंग और ऑफर: डेवलपर्स और निर्माताओं का लाभ

Eleven v3 अब पब्लिक अल्फा टेस्टिंग चरण में है और जून के महीने में 80% की छूट प्रदान की गई है, जिससे उपयोगकर्ताओं को इसकी मजबूत क्षमताओं का अनुभव करने की प्रोत्साहन दिया जा रहा है। ElevenLabs ने यह भी घोषणा की है कि v3 का पब्लिक API जल्द ही लॉन्च होगा, और डेवलपर्स को बिक्री टीम से संपर्क करके प्रारंभिक एक्सेस अधिकार प्राप्त कर सकते हैं। रियल-टाइम और बातचीत स्थितियों के लिए, ElevenLabs ने वर्तमान में v2.5 Turbo या Flash मॉडल का उपयोग करने की सलाह दी है, जिसका रियल-टाइम वर्जन भी विकसित में है, जो इसके उपयोग की सीमा को और बढ़ाएगा।

उद्योग प्रभाव: AI आवाज़ की नई लहर का नेतृत्व

AI आवाज़ प्रौद्योगिकी के तेज़ विकास के साथ, ElevenLabs v3 के रिलीज़ ने उद्योग प्रतिस्पर्धा को बढ़ा दिया है। पहले, ElevenLabs ने अपनी उच्च सटीकता वाली आवाज़ क्लोनिंग और पाठ से आवाज़ प्रौद्योगिकी के लिए महत्वपूर्ण स्थान अर्जित किया है, जो ऑडियो किताबें, डबिंग और AI कस्टमर सेवा के क्षेत्र में प्रमुख है। v3 के रिलीज़ ने इस विशेषाधिकार को और मजबूत किया है, विशेष रूप से OpenAI Whisper v3 और Google Gemini2.0 जैसे मॉडलों के साथ प्रतिस्पर्धा करते हुए, जहां v3 के बहुभाषीय समर्थन और भावनात्मक व्यक्तित्व में विशेष प्रदर्शन किया गया है। X प्लेटफ़ॉर्म पर कई उपयोगकर्ताओं ने v3 को "दुनिया का सबसे बेहतरीन पाठ से आवाज़ मॉडल" के रूप में बताया है, जो इसके प्रभाव को सूचित करता है।

ElevenLabs ने कहा है कि v3 बस उनके तकनीकी राज्यपथ का एक कदम है, और भविष्य में मॉडल के प्रदर्शन को और सुधारने का प्रयास किया जाएगा, रियल-टाइम अनुप्रयोगों के लिए कम लैटेंसी वाले वर्जन को भी बनाया जाएगा, और भाषाओं के समर्थन और स्थिति अनुकूलन को आगे बढ़ाया जाएगा। AIbase ने कहा है कि v3 का रिलीज़ ने वास्तविक जीवन में AI आवाज़ के क्षेत्र में तकनीकी ब्रेकथ्रू को प्रदर्शित किया है, और इससे कंटेंट निर्माण और मानव-मशीन इंटरैक्शन में नई संभावनाएं खुली हैं। तकनीक के प्रसार के साथ, AI आवाज़ डिजिटल कंटेंट निर्माण का केंद्रीय प्रेरक बन सकता है।

AIbase ने वादा किया है कि वे ElevenLabs और AI आवाज़ प्रौद्योगिकी के नवीनतम विकास को जारी रखेंगे और आपको सामने लाएंगे।

AI ध्वनि प्रौद्योगिकी एलेवनलैब्स एलेवनV3 पाठ से ध्वनि

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

20000 डॉलर में एक घरेलू अनुकरण? OpenAI के निवेश के साथ 1X Neo मानव रूपी रोबोट प्री-ऑर्डर शुरू करता है, अगले साल अमेरिकी परिवार में प्रवेश करता है

नॉर्वे की रोबोट कंपनी 1X ने पहला घरेलू मानव रूपी रोबोट Neo लॉन्च किया, जिसकी कीमत 20000 डॉलर है, और मासिक सदस्यता शुल्क 499 डॉलर है। यह 1.68 मीटर ऊंचा रोबोट बर्तन धोने, सजावट आदि घरेलू कार्यों के लिए डिज़ाइन किया गया है, AI और मानव द्वारा दूरस्थ सहयोग के मोड का उपयोग करता है, जिसके लिए बाहरी समर्थन की आवश्यकता होती है जटिल कार्य पूरा करने के लिए।

Oct 29, 2025

170

«डे ज़» के निर्माता ने AI के डर को पहले गूगल और विकिपीडिया के डर के समान बताया

AI तकनीक तेजी से विकसित हो रही है, खेल उद्योग में बदलाव हो रहा है। प्रकार्यात्मक AI नए अवसर और चुनौतियाँ लेकर आया है, माइक्रोसॉफ्ट, एमजेड नेटवर्क आदि कंपनियाँ अपने संसाधनों को AI अनुप्रयोगों की ओर ले जा रही हैं। खेल विकसक इस पर अलग-अलग दृष्टिकोण रखते हैं, उद्योग के भविष्य में अनिश्चितता है।

Oct 29, 2025

120

क्वालकॉम डेटा सेंटर में प्रवेश करता है! AI200/AI250 चिप के साथ नेविडिया के खिलाफ बृहत वितरण, एक दिन में 20% बढ़ी शेयर की कीमत

क्वालकॉम ने दो क्लाउड एआई रिज़ोल्यूशन चिप AI200 और AI250 लॉन्च किए, जिनका व्यावसायिक उपयोग 2026 और 2027 में होगा, जो अंत तक चिप से पूर्ण एआई बुनियादी संरचना में परिवर्तन के संकेत देता है। इस घोषणा ने एक दिन में 20% तक शेयर मूल्य को बढ़ा दिया, जो 2019 के बाद सबसे बड़ी वृद्धि है। नेविडिया के समग्र पथ के विपरीत, क्वालकॉम बड़े मॉडल रिज़ोल्यूशन बाजार पर ध्यान केंद्रित करता है और ऊर्जा दक्षता और लागत लाभ पर जोर देता है।

Oct 29, 2025

140

निवीडिया एआई केंद्र के क्रांतिकारी डिज़ाइन पेश करता है, उच्च कार्यक्षमता गणना में सहायता करता है

2025 के GTC में, निवीडिया ने 'Omniverse DSX Blueprint' डिज़ाइन पेश किया, जो गिगावाट के एआई केंद्र के लिए विशेष रूप से बनाया गया था, जिसे 'एआई कारखाना' कहा जाता है। यह डिज़ाइन Omniverse फ्रेमवर्क के आधार पर है, जो 1 करोड़ वॉट से 10 करोड़ वॉट तक के अलग-अलग आकार के लिए समर्थन प्रदान करता है, बड़े एआई मॉडल के दक्षता प्रशिक्षण और चलाने के लिए डिज़ाइन किया गया है, जो बढ़ती हुई एआई गणना आवश्यकताओं को पूरा करता है, यह मनुष्य के बुद्धिमत्ता बुनियादी संरचना में महत्वपूर्ण प्रगति है।

Oct 29, 2025

130

गूगल ने AI मार्केटिंग टूल पॉमेली लॉन्च किया: केवल वेबसाइट के पते के साथ ब्रांड कंटेंट स्वचालित रूप से बनाएं

गूगल ने पोमेली AI मार्केटिंग टूल लॉन्च किया। वेबसाइट डालते ही यह स्वचालित मार्केटिंग कॉन्टेंट बनाता है, जो छोटे-मध्यम व्यवसायों के लिए आदर्श है।....

Oct 29, 2025

अमेरिकी स senाटर ने कम उम्र के लोगों के AI चैटबॉट का उपयोग रोकने का प्रस्ताव दिया

अमेरिका के दो सीनेटर GUARD कानून का प्रस्ताव दिया, जिसमें AI कंपनियों को चैटबॉट उपयोगकर्ताओं की उम्र की पुष्टि करने की आवश्यकता होती है, 18 वर्ष से कम उम्र के युवा के लिए अयोग्य। कानून माता-पिता और सुरक्षा प्रेरकों के AI के बच्चों पर प्रभाव के चिंताओं का जवाब देता है, जिसका उद्देश्य बच्चों की सुरक्षा है।

Oct 29, 2025

हुआंग रेन्यू ने AI बुलबुला सिद्धांत को खंडित किया, नवीनतम चिप्स ने 50 अरब डॉलर की आय के लिए अपेक्षा की

वॉशिंगटन GTC में नवीदा के एमएसपी हुआंग रेन्यू ने AI बाजार के बुलबुला सिद्धांत को खंडित किया, अगले कुछ महीनों में नवीनतम Blackwell और Rubin चिप्स 50 अरब डॉलर की आय बनाने की उम्मीद है, जिससे कंपनी के अप्रत्याशित वृद्धि चक्र में प्रवेश होगा। यह नवीदा के लिए अमेरिकी राजधानी में इस सम्मेलन के आयोजन का पहला अवसर था।

Oct 29, 2025

अत्यधिक कम देरी! कार्टेसिया ने सोनिक-3 वॉइस एआई इंजन पेश किया: अद्वितीय मानवीय बातचीत देरी 100 मिलीसेकंड से कम

कार्टेसिया कंपनी ने वॉइस एआई इंजन सोनिक-3 पेश किया, जिसे विश्व के सबसे तेज और स्वाभाविक वास्तविक समय बातचीत मॉडल कहा जाता है। यह एक नई स्थिति स्पेस मॉडल आर्किटेक्चर के माध्यम से लगभग शून्य देरी वाले अंतरक्रिया को साकार करता है, मानवीय भाव, टोन और हंसी के परिवर्तन का अनुकरण कर सकता है, जो बातचीत की वास्तविकता में बहुत बढ़ोतरी करता है।

Oct 29, 2025

2025 के तीसरे तिमाही में AI एप्लिकेशन बाजार की स्थिति: मोबाइल उपयोगकर्ता 7 बिलियन को पार कर गए, डू बाओ ने मूल एआई एप्लिकेशन मासिक सक्रिय उपयोगकर्ता पहला स्थान हासिल किया

QuestMobile की रिपोर्ट के अनुसार, 2025 के तीसरे तिमाही में मोबाइल AI एप्लिकेशन उपयोगकर्ता 7 बिलियन से अधिक हो गए, मूल एप्लिकेशन, In-APP AI और मोबाइल AI असिस्टेंट के मासिक सक्रिय उपयोगकर्ता क्रमशः 287 करोड़, 706 करोड़ और 535 करोड़ हैं, जिसका संयुक्त वृद्धि दर 3.4%, 9.3% और 1.2% है। वृद्धि का मुख्य कारण निर्माता मॉडल अपग्रेड और पारिस्थितिकी सहयोग है, जबकि इंटरनेट कंपनियां बड़े मॉडल के अपडेट में सक्रिय रहती हैं।

Oct 29, 2025

130

माइक्रोसॉफ्ट और ओपनएआई के संघ के पुनर्निर्माण: 250 बिलियन डॉलर के एज़्यूर आर्डर के पीछे ओपनएआई के बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद

माइक्रोसॉफ्ट और ओपनएआई के बीच एक नया समझौता हुआ, जिसके अंतर्गत ओपनएआई 250 बिलियन डॉलर के एज़्यूर क्लाउड सेवाएं खरीदेगा, जो तकनीकी ऐतिहासिक रूप से क्लाउड खरीदारी के रिकॉर्ड को तोड़ देगा। महत्वपूर्ण अग्रिम ओपनएआई के बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद बाद

Oct 29, 2025

190

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

GEO Brand Visibility

AI Visibility Audit

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Services​

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

LLM API Hub

AI Models Finder

Model Providers

LLM Leaderboard

Compare LLMs

LLM Cost Calculator

LLM Arena

AI Model Compatibility Checker

AI Deployment Calculator

AIbase基地

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ

«डे ज़» के निर्माता ने AI के डर को पहले गूगल और विकिपीडिया के डर के समान बताया

क्वालकॉम डेटा सेंटर में प्रवेश करता है! AI200/AI250 चिप के साथ नेविडिया के खिलाफ बृहत वितरण, एक दिन में 20% बढ़ी शेयर की कीमत

निवीडिया एआई केंद्र के क्रांतिकारी डिज़ाइन पेश करता है, उच्च कार्यक्षमता गणना में सहायता करता है

गूगल ने AI मार्केटिंग टूल पॉमेली लॉन्च किया: केवल वेबसाइट के पते के साथ ब्रांड कंटेंट स्वचालित रूप से बनाएं

अमेरिकी स senाटर ने कम उम्र के लोगों के AI चैटबॉट का उपयोग रोकने का प्रस्ताव दिया

हुआंग रेन्यू ने AI बुलबुला सिद्धांत को खंडित किया, नवीनतम चिप्स ने 50 अरब डॉलर की आय के लिए अपेक्षा की

अत्यधिक कम देरी! कार्टेसिया ने सोनिक-3 वॉइस एआई इंजन पेश किया: अद्वितीय मानवीय बातचीत देरी 100 मिलीसेकंड से कम

संबंधित AI समाचार अनुशंसाएँ

«डे ज़» के निर्माता ने AI के डर को पहले गूगल और विकिपीडिया के डर के समान बताया

क्वालकॉम डेटा सेंटर में प्रवेश करता है! AI200/AI250 चिप के साथ नेविडिया के खिलाफ बृहत वितरण, एक दिन में 20% बढ़ी शेयर की कीमत

निवीडिया एआई केंद्र के क्रांतिकारी डिज़ाइन पेश करता है, उच्च कार्यक्षमता गणना में सहायता करता है

गूगल ने AI मार्केटिंग टूल पॉमेली लॉन्च किया: केवल वेबसाइट के पते के साथ ब्रांड कंटेंट स्वचालित रूप से बनाएं

अमेरिकी स senाटर ने कम उम्र के लोगों के AI चैटबॉट का उपयोग रोकने का प्रस्ताव दिया

हुआंग रेन्यू ने AI बुलबुला सिद्धांत को खंडित किया, नवीनतम चिप्स ने 50 अरब डॉलर की आय के लिए अपेक्षा की

अत्यधिक कम देरी! कार्टेसिया ने सोनिक-3 वॉइस एआई इंजन पेश किया: अद्वितीय मानवीय बातचीत देरी 100 मिलीसेकंड से कम

GEO Services