爱诗科技推出PixVerse V5.5(国内版“拍我AI V5.5”),实现全量升级并开放体验。该模型是国内首个支持“多镜头+音画同步一键直出”的AI视频大模型,推动AI生成视频从“单镜头素材”进入“完整叙事短片”阶段。基于自研MVL架构,V5.5能在5-10秒内自动完成脚本拆解、分镜调度及音效生成,显著提升视频制作的完整性与效率。
PixVerse AI V5.5版本上线,用户通过一句话即可生成带声音、口型同步的高清视频,并支持智能多镜头自动切换,大幅简化视频制作流程。该版本提供5秒、8秒、10秒多镜头选项,可一键生成包含远景、中景、近景的自然切换镜头,使运镜更流畅。
可灵AI公司宣布,其O1视频大模型已全量开放。该模型采用多模态视觉语言统一架构,支持文字、图像、视频融合输入,并引入思维链推理,号称全球首个统一多模态视频大模型。它可一次性完成文生视频、图生视频、局部编辑及镜头延展等任务,无需分步操作。
智谱AI推出清影2.0,基于自研CogVideoX模型,可直接生成1080P高清视频,最长10秒。模型全面控制运动、镜头和风格,支持多视频同时生成及镜头指定。实测画质接近Sora,中文提示理解更准、生成更快。还集成CogSound音效模块,实现文本到视频的高效创作。
基于OpenAI技术,可秒将文本转成含多镜头、同步音频的逼真AI视频
使用Seedance AI,从文本生成电影级的多镜头视频。先进的AI能创建具有动态镜头运动的连贯叙事。
专业AI视频生成平台
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
-
Anthropic
$105
$525
200
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$2
$20
$8
$240
52
Bytedance
$1.2
$3.6
4
TencentARC
AnimeGamer是专为无限动漫人生模拟设计的开创性模型,利用多模态大语言模型生成动态动画镜头,打造沉浸式游戏体验。