快手旗下可灵AI推出首个“音画同出”模型可灵2.6,能同时生成画面、语音、音效和环境氛围,打通音画世界。该模型提供“文生音画”和“图生音画”两种创作路径,用户可通过一句话或图片快速生成完整视频,提升创作体验。
可灵AI公司宣布,其O1视频大模型已全量开放。该模型采用多模态视觉语言统一架构,支持文字、图像、视频融合输入,并引入思维链推理,号称全球首个统一多模态视频大模型。它可一次性完成文生视频、图生视频、局部编辑及镜头延展等任务,无需分步操作。
美团LongCat团队发布视频生成模型LongCat-Video,基于DiT架构,能精准重构真实世界动态,支持文生视频、图生视频和视频续写功能。这标志着美团在世界模型领域取得重要进展,该模型是下一代AI核心引擎,助力AI更好地理解和预测现实世界。
快手可灵2.5Turbo模型在AI视频生成领域表现突出,于9月23日推出后,在Artificial Analysis基准测试中,图生视频和文生视频分别获1329和1252分,超越Veo3等对手,登顶全球榜单第一。
VORAvideo连接多AI模型,支持文生视频、图生视频,享Sora 2特惠
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$6
$24
$2
$20
Baidu
128