字节跳动推出AI视频生成模型Seedance2.0,支持文本、图像、音频及视频多输入,可生成1080p高保真视频,实现音视频同步,提升运动稳定性和物理真实感。在独立盲测中,其文本到视频生成表现优异。
字节跳动火山引擎将于2月14日发布技术升级,重点推出“豆包”系列2.0版本,包括音视频工具Seedance2.0和图像工具Seedream5.0Preview。Seedance2.0在交互与画面稳定性上达到行业领先,支持全模态输入,输出质量满足影视广告等专业需求。Seedream首次引入实时信息检索功能,确保创作内容与社会时事同步。
字节跳动推出“Seedance1.5Pro”音视频创作模型,现已上线豆包平台。该模型实现“文字-画面-声音”一体化生成,能深度理解文本意图,同步创作匹配的画面、音效与人物台词,有效避免音画脱节,并提升人物“开口说话”的自然度,让普通用户也能轻松制作有声视频。
字节跳动发布新一代音视频创作模型Seedance1.5pro,支持文本或图像引导生成音视频内容,在视觉冲击力和运动效果上实现技术升级,为用户带来更丰富的视听体验。
Seedance 2.0可将人脸融入AI视频,支持多模态输入,有60免费额度。
Seedance 2.0可将文本、图像等快速转化为2K同步音视频
专业AI视频生成器,具备音视频同步、多语言唇形同步和电影级镜头控制
免费快速AI视频生成器,用图或文本创建10秒音视频同步HD视频
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
$17.5
Alibaba
$2
$20
-
$8
$240
52
$3.9
$15.2
64
$15.8
$12.7
Bytedance
$0.8
256
Baidu
Tencent
24
$2.4
$12
8
32
TencentARC
ARC-Qwen-Video-7B是腾讯ARC实验室开发的用于理解现实世界短视频的多模态模型,基于Qwen2.5-VL-7B-Instruct构建,支持音视频同步分析和理解。