快手旗下 可灵 AI 今日正式发布「主体库」(Subject Library),为 O1多模态视频模型添加“长期记忆”能力。用户上传单张角色图,系统即可生成3D 视角补全、多光线变体,并支持跨场景「@角色名」一键调用,官方宣称「主体一致性>96%,彻底告别 AI 变脸」。

从单图到3D 记忆——主体库三步流程
1. 上传:支持 JPG/PNG/RAW,自动抠图、对齐、色彩归一
2. 补全:AI 生成侧脸、背面、局部细节,提供3组方案供选择
3. 调用:提示词输入「@角色名」即可在任意镜头、光照、风格下保持同一面孔与服饰细节

AI 智能描述——让模型读懂你的创意
- 系统自动提取「发色+服饰+风格」并生成60字以内关键词,用户可二次编辑
- 实验显示,使用智能描述后,复杂场景一次生成成功率提升27%,平均节省12分钟手动调参

O1模型统一入口——文本-图像-视频无缝衔接
主体库与 O1的「文本生视频」「图像生视频」「首尾帧控制」共用底层 latent 空间,实现:
- 同一角色在多段视频里连续出现,ID 漂移<0.03
- 支持48fps/1080p 输出,单条最长达5分钟
- 官方统计,自2024年上线以来 Kling AI 已迭代30+ 次,累计生成2亿条视频
行业冲击——短视频进入“一致性”时代
- 影视预览:制片方可用主体库锁定主角造型,快速生成故事板,降低外景复拍成本
- 跨境电商:商家一次性上传模特图,即可批量产出多语种试穿视频,制作成本降至1/10
- 虚拟偶像:IP 方将 V 形象存入库内,粉丝通过「@角色」即可生成二创视频,无需再担心“换脸”
开放计划与价格
- 免费版:最多存储5个主体,每月50次调用
- Pro 版:29元/月,主体数无上限,送600次调用+5分钟高清生成
- Enterprise API:按调用量计费,0.005元/次,支持私有化部署与品牌定制
下一步:多人协同与实时风格化
可灵 AI 透露,2025Q1将上线「多人主体库」与「实时风格化」——同一画面可锁定3位角色,并实时切换卡通、复古、赛博等全局风格,进一步向长剧、广告、游戏动画管线渗透。
编辑观点
当行业仍在为“单条视频4K60fps”卷参数时,可灵 把战场拉到“跨镜头一致性”,相当于给创作者一颗「数字记忆芯片」。一旦主体库成为行业标准,AI 视频将完成从“好玩”到“好用”的跃迁,短视频、广告乃至长剧工业化流程或被重写。AIbase 将持续关注其多人协同功能开放与 Enterprise 版定价。