Black Forest Labs正式宣布,其全新图像编辑模型 FLUX.1Kontext [dev] 现已开源,引发了AI社区的广泛关注。

这一模型作为FLUX.1系列的最新成员,以其强大的图像编辑能力和高效性能被誉为可媲美GPT-4o的开源替代方案。FLUX.1Kontext [dev] 基于12亿参数的流匹配变换器架构,专为图像编辑任务设计,支持消费级硬件运行,为创作者、开发者和研究人员提供了前所未有的灵活性。

image.png

核心功能:上下文感知与精准编辑

FLUX.1Kontext [dev] 的最大亮点在于其 上下文感知图像生成与编辑能力。与传统仅基于文本提示的图像生成模型不同,该模型能够同时理解文本和图像输入,实现真正的上下文生成与编辑。

用户可以通过简单的文本指令修改现有图像,例如更改特定区域的颜色、风格或背景,同时保持角色或对象的风格一致性。此外,模型支持多次迭代编辑,最大程度减少视觉漂移,确保图像质量和一致性。

开源赋能社区创新

作为开源模型,FLUX.1Kontext [dev] 采用非商业许可,兼容之前的FLUX.1[dev]推理代码,允许研究人员和艺术家在个人、科研及特定商业场景下自由使用。

Black Forest Labs表示,该模型通过指导蒸馏技术训练,显著提升了效率,为社区提供了定制化开发的可能性。AIbase注意到,模型已在多个平台上线,包括Replicate、Hugging Face等,社区开发者已开始探索其在艺术创作、内容生成等领域的创新应用。

负责任的AI开发

Black Forest Labs强调对生成式AI技术的负责开发。在FLUX.1Kontext发布前,团队通过数据过滤和与Internet Watch Foundation合作,减少了不安全内容生成的风险。

模型输出内容还采用C2PA标准添加加密签名元数据,确保内容溯源。此外,Black Forest Labs将通过API监控使用情况,防止违反政策的行为,展现了其在技术创新与伦理平衡上的努力。

行业影响与未来展望

FLUX.1Kontext [dev] 的开源发布标志着图像编辑领域的又一里程碑。AIbase认为,其高效的迭代编辑能力和对消费级硬件的适配性,将极大降低专业图像编辑的门槛,助力更多创作者实现创意。相较于OpenAI的GPT-4o图像编辑功能,FLUX.1Kontext [dev] 在速度和成本上更具优势,预计将推动开源社区与闭源模型的竞争。

未来,Black Forest Labs计划进一步优化模型,并探索文本到视频的扩展应用,为生成式AI注入新的活力。

开源地址:https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev

Github:https://github.com/black-forest-labs/flux