快手可灵AI发布数字人模型Avatar2.0,用户仅需提供一张照片和一段音乐,即可生成长达5分钟的唱歌视频。该模型显著提升了数字人的表现力,使其能够自然展现表情和肢体动作,告别僵硬“对口型”模式。这标志着AI内容创作从静态向动态叙事的重大进步。
快手可灵数字人2.0全面上线,用户仅需三步即可生成“能说会演”的数字人视频。新版本支持上传角色图片、添加配音并描述表现,最终可生成长达5分钟的视频。相比旧版,2.0版本在表现力上显著提升,实现了手部动作和口型的精准控制。
快手可灵AI推出2.6版本,实现“音画同出”功能,可一次性生成画面、语音、音效及环境氛围,提升内容创作效率。
快手旗下可灵AI推出首个“音画同出”模型可灵2.6,能同时生成画面、语音、音效和环境氛围,打通音画世界。该模型提供“文生音画”和“图生音画”两种创作路径,用户可通过一句话或图片快速生成完整视频,提升创作体验。
快手官方视频剪辑神器,创作有趣的视频
可灵大模型是由快手大模型团队自研打造的视频生成大模型,让用户可以轻松高效地完成艺术视频创作。
智能创作与形象定制的AI艺术平台
Kwai-Klear
Klear是由快手Kwai-Klear团队开发的稀疏混合专家(MoE)大语言模型,具备高性能和推理效率的特点。总参数460亿,激活参数仅25亿,在多个能力基准测试中表现出色,为实际应用提供了高效且强大的解决方案。
Kwai-Keye
快手Keye-VL是由快手Keye团队打造的前沿多模态大语言模型,在视频理解、视觉感知和推理任务中表现卓越。1.5版本通过创新的快慢视频编码策略、LongCoT冷启动数据管道和强化学习训练策略,在视频理解、图像感知和推理能力上达到新高度,支持长达128k标记的扩展上下文长度。
Kwai-Kolors
可图(Kolors)是快手可图团队自研的大规模文生图潜空间扩散模型,在生成图像视觉质量、复杂语义还原度、中英文字体渲染等方面表现优异。