豆包视频生成模型Seedance1.5Pro正式上线火山方舟,提升AI视频创作效率与质量。该模型支持音画同步输出、多语言多人对白配音,并具备突出的影视级叙事张力。企业用户可通过火山方舟获取API服务,个人用户也可使用。
字节跳动推出“Seedance1.5Pro”音视频创作模型,现已上线豆包平台。该模型实现“文字-画面-声音”一体化生成,能深度理解文本意图,同步创作匹配的画面、音效与人物台词,有效避免音画脱节,并提升人物“开口说话”的自然度,让普通用户也能轻松制作有声视频。
阿里巴巴12月16日发布新一代万相2.6系列模型,针对影视制作和图像创作全面升级,号称“全球功能最全的视频生成模型”。该模型已上线阿里云百炼和官网,核心亮点包括国内首个“角色扮演”功能,并支持音画同步、多镜头生成及声音驱动等,在画质、音效等方面实现技术突破。
阿里千问APP接入万相2.5模型,视频创作能力升级,动作精度和肢体协调性提升,成为首个支持音视频同步输出的移动端AI助手。该模型具备音画同步能力,支持多模态输入输出,在LMArena评测中图生视频能力全球第三。
ByteDance的Seedance 1.5 Pro,用DB - DiT生成带音画同步的电影级视频
通过 EvoLink 集成,生成 10 - 15 秒音画同步写实视频,扩展 AI 视频生产规模
Sora 2 AI可将文本和图像转化为4K分辨率、音画同步的专业视频
Ovi AI视频生成器,无需注册,秒速生成物理精确且音画同步的专业视频。
Alibaba
-
Input tokens/M
Output tokens/M
Context Length
Baidu
Moonshot
$10
$30
131