上海黄浦区法院一审判决AI提示词不具备作品独创性,不构成著作权侵权。这是上海首例涉AI提示词著作权案,法院认为提示词缺乏独创性,因此不受著作权法保护。
北京大学与兔展智能联合推出UniWorld-V2图像编辑模型,基于创新的UniWorld-R1强化学习框架,首次将策略优化应用于图像编辑。该模型在细节控制上超越Nano Banana,对中文指令理解精准,显著提升编辑准确性与灵活性,突破传统监督学习局限。
Canva旗下Affinity设计软件发布全新版本,深度整合矢量设计、图像编辑与排版功能,并宣布永久免费,直接挑战Adobe订阅模式。新版支持macOS与Windows系统,用户可在单一应用中通过"Persona"模式无缝切换绘图、修图与排版功能。软件延续高性能特性,支持非破坏性编辑、高级图层控制等专业功能。
字节跳动联合香港三所大学开源DreamOmni2系统,突破性提升AI图像编辑生成能力。该系统实现多模态指令理解,可同时处理文本指令与参考图像,显著改善抽象任务处理效果,推动图像生成技术发展。
免费AI图像编辑器和生成器,可去背景、提升画质、生成AI艺术图像。
Gempix2 AI可锁定角色身份,轻松生成和编辑跨场景的高分辨率4K图像。
Google基于Gemini 3 Pro的AI图像编辑器,推理强,生成编辑能力出色
insMind免费AI文本转视频生成器,在线根据文本提示创建精彩视频
tencent
$18
Input tokens/M
Output tokens/M
32k
Context Length
valiantcat
Qwen-Image-Edit-Cosplay LoRA是基于Qwen-Image-Edit-2509图像编辑模型微调而来的动漫角色装扮迁移模型,专注于将动漫人物的发型、服饰和装饰道具精准迁移到真实人物图像上,同时保持原始人物的面部特征。
OPPOer
基于Qwen-Image-Edit进行模型剪枝的版本,移除了20层,保留40层权重,最终模型大小为13.6B参数。这是一个图像编辑模型,支持多图像输入和文本引导的图像合成与编辑。
dx8152
这是一个基于Qwen-Edit模型的Lora图像融合工具,专门用于图像到图像的转换任务,能够实现出色的图像融合效果,特别擅长白膜转材质等图像编辑功能。
这是一个基于Qwen-Image-Edit的图像编辑Lora模型,专门用于白膜转材质等图像融合任务,表现非常出色。
Qwen-Image-Edit-MeiTu是基于Qwen-Image-Edit的改进版本,采用DiT架构微调,专注于提升复杂图像编辑中的视觉一致性、美学质量和结构对齐能力。
ostris
这是一个基于Qwen-Image-Edit-2509的LoRA模型,专门用于将设计图案精准地应用到人物衬衫上,为图像编辑提供新的可能性。
cyburn
qwen_edit_photo_restore_v1-lora是一个基于Qwen-Image-Edit模型训练的LoRA适配器,专门用于图像编辑和修复任务。该模型使用AI Toolkit by Ostris进行训练,支持多种主流AI平台,提供高质量的图像处理能力。
flymy-ai
这是一个由FlyMy.AI开发的开源LoRA模型,专为Qwen-Image-Edit设计,专注于场景内图像编辑,通过低秩自适应技术增强对场景构图和对象定位的控制能力。
QuantStack
Qwen-Image-Edit-2509 GGUF是基于Qwen/Qwen-Image-Edit-2509模型转换的量化版本,专门用于图像到图像的处理任务。该模型保留了原模型的核心能力,支持在ComfyUI环境中进行图像编辑和处理。
calcuis
Qwen Image Edit Plus GGUF 是一个基于 Qwen 模型的图像编辑项目,提供多种运行方式,支持图像编辑和生成任务。该项目通过 GGUF 格式优化了模型部署和运行效率。
Qwen
通义图像编辑模型的月度迭代版本,支持多图像编辑,提升了单图像编辑的一致性,并原生支持ControlNet,为图像编辑带来更强大的功能和更好的效果。
Qwen-Image是通义系列的多模态图像生成基础模型,在复杂文本渲染和精确图像编辑方面表现卓越,特别擅长中文文本渲染,支持多种图像生成和编辑任务。
OmniGen2
OmniGen2 是一个强大且高效的统一多模态模型,由 3B 视觉语言模型和 4B 扩散模型构成,支持视觉理解、文本到图像生成、指令引导的图像编辑和上下文生成。
RiverZ
这是一个基于LoRA技术的图像到图像转换模型,主要用于非商业用途的图像编辑任务。
ICEdit是一种创新的指令式图像编辑方法,通过大规模扩散变换器实现高效编辑,仅需0.5%的训练数据和1%的参数规模即可达到SOTA效果。
sanaka87
ICEdit是一种基于大规模扩散变换器的指令式图像编辑方法,仅需0.5%的训练数据和1%的参数即可实现最先进的编辑效果。
aihpi
基于Shuttle-3.1-Aesthetic构建的专用时尚图像编辑模型,擅长处理时尚相关的修改任务。
finetrainers
基于THUDM/CogView4-6B模型的图像编辑微调控制LoRA,支持通过文本指令对图像进行风格转换和内容编辑
SherryXTChen
InstructCLIP是一种通过对比学习自动优化数据的模型,旨在提升指令引导的图像编辑效果。
Instruct-CLIP 是一个基于对比学习的模型,用于优化指令引导的图像编辑任务。
adb-mcp是一个概念验证项目,旨在通过MCP协议为LLM提供接口,创建控制Adobe工具(如Photoshop和Premiere)的AI代理。该项目包含MCP服务器、Node命令代理服务器和Adobe应用插件,支持自然语言指令操作Adobe软件,适用于图像和视频编辑自动化。
一个基于OpenAI DALL-E API的MCP服务器,提供图像生成、编辑和变体功能,支持与Cline集成。
基于Google Gemini 2.5 Flash API的MCP图像生成与编辑服务器,支持文本生成图像、图像编辑、迭代创作和风格迁移功能
DALL-E MCP服务器是一个通过OpenAI的DALL-E API生成、编辑和创建图像变体的服务,支持与Cline集成,提供图像生成和处理功能。
Imagician是一个基于Model Context Protocol(MCP)的图像处理服务器,提供包括调整大小、格式转换、裁剪、压缩等多种图像编辑功能。
Gemini Nanobanana MCP 是一个让用户通过文本描述生成AI图像的Claude插件,集成了Google Gemini 2.5 Flash图像生成功能,支持多种图像编辑和创作方式。
一个集成4o-image API的MCP服务器,支持通过文本生成和编辑图像。
一个集成4o-image API的MCP服务器实现,支持通过标准化协议让LLM和AI系统生成和编辑图像,包括文本生成图像、图像编辑等功能。
GIMP-MCP项目旨在通过模型上下文协议(MCP)将GIMP与AI模型集成,提供智能图像编辑功能,如背景移除、图像修复等。
这是一个让用户通过自然语言对话控制GIMP图像编辑软件的MCP项目,将复杂的图像处理操作转化为简单的对话指令,支持从基础调整到高级特效的各种图像编辑功能。
该项目实现了一个MCP服务器,通过OpenAI的gpt-image-1模型提供图像生成和编辑功能,支持文本描述生成图像、基于参考图像编辑或修复图像,并可将结果保存到本地。
基于Google Gemini 2.5 Flash Image API的MCP服务器,提供文本生成图像、图像编辑、多图合成和风格转换等功能,支持多种MCP客户端使用。
MAVAE是一个基于MCP协议的图像处理工具包,提供图像生成、编辑、集合管理等功能,支持AI代理标准化操作。