PlayDiffusion發佈:開源擴散模型實現語音“局部修改”不留痕
Play AI 日前開源推出了一款全新語音編輯模型——PlayDiffusion,這是一種基於擴散模型的創新性工具,專爲語音局部修改而設計。不同於傳統的文本轉語音系統需對整段音頻重生成,PlayDiffusion 支持直接對語音中的某一部分進行替換、刪除或調整,而其他未修改部分將保持完全一致。這種方式不僅極大提高了效率,也讓音頻編輯進入“所聽即所得”的新階段。用戶只需提供目標文本(例如將音頻中的“Neo”改爲“Morpheus”),模型便可精準識別需替換位置,並智能調整節奏、語調以及說話人的