स्टेशन मास्टर होम ने रिपोर्ट किया कि फुडान विश्वविद्यालय के शोधकर्ताओं ने SpeechGPT-Gen लॉन्च किया है, जो एक 8B पैरामीटर वाला वॉयस बड़े भाषा मॉडल है जिसमें अर्थ और संवेदनशील जानकारी मॉडलिंग की उच्च दक्षता है। यह मॉडल शून्य उदाहरण टेक्स्ट-टू-स्पीच, स्पीच रूपांतरण और स्पीच संवाद जैसे कई अनुप्रयोगों में उत्कृष्ट प्रदर्शन और स्केलेबिलिटी दिखाता है। सूचना श्रृंखला उत्पादन (CoIG) विधि का उपयोग करते हुए, इसने पारंपरिक वॉयस उत्पादन विधियों में कम दक्षता की समस्या को हल किया है। इसके अलावा, इस मॉडल ने प्रवाह मिलान में पूर्व ज्ञान के रूप में अर्थ जानकारी का उपयोग किया है, जिससे मॉडल की दक्षता और आउटपुट गुणवत्ता में सुधार हुआ है।
स्पीचजीपीटी-जेन: 8B पैरामीटर, ज़ीरो शॉट生成语音

站长之家
यह लेख AIbase दैनिक से है
【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।