字节跳动推出“Seedance1.5Pro”音视频创作模型,现已上线豆包平台。该模型实现“文字-画面-声音”一体化生成,能深度理解文本意图,同步创作匹配的画面、音效与人物台词,有效避免音画脱节,并提升人物“开口说话”的自然度,让普通用户也能轻松制作有声视频。
阿里巴巴12月16日发布新一代万相2.6系列模型,针对影视制作和图像创作全面升级,号称“全球功能最全的视频生成模型”。该模型已上线阿里云百炼和官网,核心亮点包括国内首个“角色扮演”功能,并支持音画同步、多镜头生成及声音驱动等,在画质、音效等方面实现技术突破。
多模态AI公司ElevenLabs推出集成式内容创作平台,融合图像生成、视频制作、声音合成、音乐创作和音效设计功能,实现从剧本到成品视频的一站式闭环生产,帮助创作者和营销人员告别多平台切换,高效完成商业视频制作。
Hume AI推出全新“语音转换”功能,用户仅需一次录音即可将原声的节奏、发音和语调精准移植到任意目标声音,实现无缝融合与个性化表达。该功能已在创作工作室和API平台上线,标志着语音AI从机械朗读向情感共鸣的转变,开启无限创意可能。
在线即时改变声音,可创建多种声线,适用于多场景创作。
通过先进的AI生成专业音乐,轻松创作版权免费的节拍、旋律和声音,适合创作者和音乐人。
ToMoviee AI是一款全能AI创意工作室,可以快速生成视频、图像、音乐和声音,适用于创作者、营销人员、电影制作人、设计师和团队。
全球技术领先的AI数字人创作平台,快速复刻形象和声音,高效创作视频。
Google
$0.7
Input tokens/M
$2.8
Output tokens/M
1k
Context Length
Anthropic
$21
$105
200
Alibaba
$1
$10
256
-
$3.9
$15.2
64
Moonshot
$4
$16
Bytedance
Tencent
32
$54
$163
Openai
$8.75
$70
400
$15
Huawei
Chatglm
128
$8