騰訊發佈AudioStory模型,利用大語言模型生成長篇敘事音頻,解決現有技術處理短音頻的侷限。該模型通過統一理解與生成框架,支持視頻配音、音頻延續和長篇合成等任務,結合大語言模型與音頻生成系統提升時間連貫性和組合推理能力。
騰訊ARC實驗室發佈AudioStory技術,突破AI音頻生成侷限,能根據用戶描述即時生成電影級音頻場景,如懸疑追逐戰等,實現從單一音效到複雜敘事音頻的跨越。