摆脱人工标注魔咒!趣丸科技MaskGCT模型用10万小时数据,教会AI自己说话
近期,趣丸科技发布了名为MaskGCT的全新语音合成(TTS)模型,该模型在语音质量、相似度和可控性方面取得了显著突破,直接颠覆了传统语音合成(TTS)的玩法,让AI彻底摆脱了对人工标注的依赖,实现了真正意义上的“自学成才”。传统的TTS系统,就像一个被溺爱的孩子,必须得人工一字一句地教它说话,先把文本和语音对齐,再预测每个音节的时长,最后才能磕磕绊绊地合成语音。这种方式,不仅效率低,而且生成的语音也缺乏自然流畅的韵律。而字节跳动这次祭出的MaskGCT,则完全抛弃