生数科技今日宣布其视频大模型 Vidu 的 Q1参考生图功能正式向公众用户开放,此次功能的推出旨在突破多主体一致性技术的瓶颈,将 AI 图像生成与视频生成的商业生产链闭环,推动 AI 多模态创作进入全新阶段。

QQ20250909-142106.png

Vidu Q1参考生图的推出围绕 “五大亮点” 展开,首先,其支持同时输入多达7张参考图,使得创作过程中可控性显著增强。其次,Vidu Q1在多主体、多场景的生成能力上展现出更强的一致性,无论是在多次生成的情况下,人物和主体的面貌及特征始终保持一致,确保了高还原度和真实感。此外,用户只需提供一张图和一句提示词,即可自由更换服装和背景,实现高自由度的创作。

生数科技表示,Vidu Q1参考生图的多图参考时代标志着一致性技术的重大突破,允许用户在复杂场景下灵活创作,增强了图像生成的真实感和适用性。以往的 AI 创作工具多以激发灵感为主,而 Vidu Q1则将 AI 的角色扩展至内容生产的主导者,用户只需监督,极大降低了内容生产的门槛。

QQ20250909-142136.png

在具体应用方面,Vidu Q1提供了合成、替换和变换三种生成模式。例如,用户可以将不同人物合成在同一场景中,或是将已有照片的背景更换为新的场景,从而轻松生成个性化的内容。此外,该工具在服装设计、广告宣传、创意营销等领域的应用潜力巨大,能够帮助设计师和电商快速产出高质量的素材。

生数科技的此次创新,标志着 AI 生图工具在商业化应用上的新里程碑。公司希望通过这一先进技术,推动行业内更多企业和个人用户开启多模态创作的新纪元,真正实现 AI 技术为生产力赋能的目标。