昆仑万维宣布其天工 AI 大模型 SkyReels V4在 Artificial Analysis 的文生视频(含音频)赛道中荣登全球第一。该模型性能显著超越了 Kling3.0、Google Veo3.1、Vidu Q3及 OpenAI Sora2等主流模型,成为目前全球视频生成能力最强的 AI 大模型。

核心突破:全模态强化学习与逻辑推理
SkyReels V4在技术架构上实现了两大核心变革,解决了视频生成中的一致性与叙事逻辑难题:
强化学习体系(RL):通过搭建全模态语义 Reward 模型并采用阶梯式课程学习路径,为模型注入了逻辑推理能力,实现了1080p15秒商用级长序列生成。
高阶参考任务:新增“关键帧参考”与“网格图参考”能力。前者可精准推演节点间的连贯画面;后者支持上传多张剧情图,确保短剧创作中角色特征与场景风格全程统一。
随着榜单登顶,SkyReels V4的 API 入口也正式面向全场景开放。其能力完整覆盖了该模型的所有核心功能:
全功能覆盖:包括文生视频、图生视频、多模态参考生成、视频编辑与修复以及音画联合生成。
低门槛赋能:电商、教育、内容平台及开发者团队无需投入巨额研发成本,即可直接调用全球顶尖的音视频生成能力。
昆仑万维此前已陆续发布并开源了 SkyReels 系列多个模型。从 V1的人像驱动到 V2的长视频生成,再到如今 V4在音画同步与逻辑表现上的全面爆发,SkyReels 展现了从“能生成”到“生成得好”的跨越。
目前,SkyReels V4的技术报告已同步发布,开发者可通过其官网平台获取 API 文档并开展业务集成。这一进展标志着中国 AI 在视听内容生成的垂直赛道上已处于全球领先位置。



