阿里通义实验室推出PrismAudio框架,解决AI视频生成中音画不同步问题。该技术引入“思维链”机制,先分析视频内容再生成匹配音效,提升沉浸感。研究已被ICLR2026收录。
阿里巴巴通义实验室与中国科学技术大学联合开源Fun-CineForge项目,针对影视配音中口型同步、音色迁移和情感表达等难题,提供端到端生产流水线和大模型解决方案,旨在解决传统AI配音口型不匹配、情感生硬及难以适应复杂场景的问题。
阿里通义实验室发布并开源了Fun-CineForge模型,旨在解决AI配音中的口型不同步、情感缺失及多角色音色不一致等问题。该模型创新引入“时间模态”概念,通过精准时间戳控制,确保语音与画面同步,并同步开放高质量数据集构建方法。
阿里通义实验室发布并开源全球首个支持影视级、多场景配音的多模态大模型Fun-CineForge,旨在突破AI配音在情感表达、环境音融合及口型同步等方面的技术瓶颈,推动影视行业配音环节的智能化变革。
一体化AI平台,含30+模型,可轻松创建视频、图像和配音。
与AI聊天,用Seedance 2.0创作视频,支持唇形同步和AI配音。
免费AI视频剪辑与再利用工具,自动灵感、字幕、配音,速创爆款视频
Aivvid AI是一体化AI创意平台,可生成视频、图像、音乐和配音。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
$6
$24
256
Baidu
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
VideoLingo是一款集视频翻译、本地化和配音于一体的工具,旨在生成Netflix品质的字幕。它消除了生硬的机器翻译和多行字幕,同时提供高质量的配音,实现跨语言的知识共享。