谷歌新語音克隆技術:僅需幾秒鐘音頻樣本,即可實現聲音克隆
在科技迅猛發展的今天,語音合成技術也在進步,尤其恢復失去聲音領域。最近,谷歌研究人員們提出了一種名爲 “零樣本語音轉換(zero-shot voice transfer)” 的新技術項技術可以直接與最先進的文本語音(TTS)系統相結合,幫助那些因疾病事故失去聲音的人,找回他們的 “聲音記憶。這項技術的核心在於 “零樣本” 能力,意味着我們不需要大量樣本就能實現語音轉換。也就是說,僅需幾秒鐘的參考音頻,即可實現聲音克隆,且支持合成跨語言的音頻。“零樣本” 克隆聲音能力研究團隊