擺脫人工標註魔咒!趣丸科技MaskGCT模型用10萬小時數據,教會AI自己說話
近期,趣丸科技發佈了名爲MaskGCT的全新語音合成(TTS)模型,該模型在語音質量、相似度和可控性方面取得了顯著突破,直接顛覆了傳統語音合成(TTS)的玩法,讓AI徹底擺脫了對人工標註的依賴,實現了真正意義上的“自學成才”。傳統的TTS系統,就像一個被溺愛的孩子,必須得人工一字一句地教它說話,先把文本和語音對齊,再預測每個音節的時長,最後才能磕磕絆絆地合成語音。這種方式,不僅效率低,而且生成的語音也缺乏自然流暢的韻律。而字節跳動這次祭出的MaskGCT,則完全拋棄