阿里通義實驗室推出新型數字人生成模型,音視頻合成更真實!
阿里通義實驗室近日發佈了一款名爲 “OmniTalker” 的新型數字人視頻生成大模型。這一創新模型的核心在於其能夠通過上傳一段參考視頻,實現對視頻中人物的表情、聲音和說話風格的精準模仿。相較於傳統的數字人制作流程,OmniTalker 顯著降低了製作成本,同時提升了生成內容的真實感和互動體驗,滿足了廣泛的應用需求。OmniTalker 的使用十分簡便,用戶只需在平臺上上傳一段參考視頻,就能生成與之同步的音頻和視頻內容。目前,該項目已在魔搭社區和 HuggingFace 等平臺開放體驗,並提