Diffusion 模型也能“举一反三”?阿里IC-LoRA给图像生成模型增加情节记忆力能力
阿里巴巴通义实验室最新研究表明,现有的文生图 Diffusion Transformer 模型其实已经具备生成多张具有特定关系图像的能力,只需稍加“点拨”就能“融会贯通”,生成高质量的多图集。传统的 Diffusion 模型更像是一个“死记硬背”的学生,需要用海量数据训练,才能生成高质量的图像。而有了 IC-LoRA 加持,它就变成了“触类旁通”的学霸,只需要少量样本就能学会新技能。这背后的原理说起来也不复杂,研究人员发现,现有的文生图 Diffusion 模型其实已经具备一定的“上下文学习”能力,只