谷歌新语音克隆技术:仅需几秒钟音频样本,即可实现声音克隆
在科技迅猛发展的今天,语音合成技术也在进步,尤其恢复失去声音领域。最近,谷歌研究人员们提出了一种名为 “零样本语音转换(zero-shot voice transfer)” 的新技术项技术可以直接与最先进的文本语音(TTS)系统相结合,帮助那些因疾病事故失去声音的人,找回他们的 “声音记忆。这项技术的核心在于 “零样本” 能力,意味着我们不需要大量样本就能实现语音转换。也就是说,仅需几秒钟的参考音频,即可实现声音克隆,且支持合成跨语言的音频。“零样本” 克隆声音能力研究团队