腾讯发布AudioStory模型,利用大语言模型生成长篇叙事音频,解决现有技术处理短音频的局限。该模型通过统一理解与生成框架,支持视频配音、音频延续和长篇合成等任务,结合大语言模型与音频生成系统提升时间连贯性和组合推理能力。
腾讯ARC实验室发布AudioStory技术,突破AI音频生成局限,能根据用户描述即时生成电影级音频场景,如悬疑追逐战等,实现从单一音效到复杂叙事音频的跨越。