字节跳动Seed团队发布新一代视频创作模型Seedance2.0,采用统一的多模态音视频联合生成架构,推动AI视频生成从“单点突破”迈向“全能协作”的工业级应用阶段。相比1.5版本,新模型在复杂交互与运动场景下的可用率显著提升,通过出色的物理还原能力,攻克了双人花滑、多人竞技等高难度动作生成难题。
阿里千问APP接入万相2.5模型,视频创作能力升级,动作精度和肢体协调性提升,成为首个支持音视频同步输出的移动端AI助手。该模型具备音画同步能力,支持多模态输入输出,在LMArena评测中图生视频能力全球第三。
巨人网络AI Lab联合清华大学、西北工业大学发布三项音视频多模态生成技术:YingVideo-MV(音乐驱动视频生成)、YingMusic-SVC(零样本歌声转换)和YingMusic-Singer(歌声合成)。这些技术将开源,其中YingVideo-MV仅需音乐和人物图像即可生成视频。
蚂蚁集团AI助手“灵光”上线4天,App Store中国区下载量破百万,登顶免费榜第六,速度超ChatGPT和Sora2。团队紧急扩容保障核心功能稳定。产品亮点:用户用自然语言30秒生成可编辑、可交互的小程序,支持3D、音视频等多模态输出,零门槛操作。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
-
Anthropic
$105
$525
200
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
$6
$24
$8
$240
52
TencentARC
ARC-Qwen-Video-7B是腾讯ARC实验室开发的用于理解现实世界短视频的多模态模型,基于Qwen2.5-VL-7B-Instruct构建,支持音视频同步分析和理解。