AI设计平台Lovart推出Touch Edit触控功能,公测48小时吸引超10万创作者。该功能通过快捷键自动识别并锁定发丝、服饰等元素,用户只需用自然语言描述修改需求,即可在4K分辨率下即时完成融合,无需手动操作。同时支持多图上传,系统自动编辑混搭。
谷歌视频编辑平台Vids向所有用户免费开放AI功能,包括语音配音、自动去除冗余口语和图像编辑等。用户只需上传视频,系统即可自动识别并精简冗余内容。
谷歌AI电影工具Flow新增图像编辑功能,集成Gemini2.5Flash模型,支持自然语言指令实现去背景、主体分离和场景替换,可生成8秒动态镜头。面向免费及以上用户开放,单张处理0.039美元,企业版同步上线Vertex AI。用户上传图片后输入提示词,即可获得PNG透明图或合成效果图。
上海黄浦区法院一审判决AI提示词不具备作品独创性,不构成著作权侵权。这是上海首例涉AI提示词著作权案,法院认为提示词缺乏独创性,因此不受著作权法保护。
免费在线高级AI图像生成与编辑器,快速生成逼真图像并编辑
GPT Image 2是AI图像生成与编辑器,可秒速生成高分辨率图像。
免费无限使用Nano Banana Pro,借助Gemini 3.0 Pro创建4K图像
强大的AI图像编辑平台,用GPT - Image - 2技术生成、编辑和增强专业图像。
tencent
$18
Input tokens/M
Output tokens/M
32k
Context Length
kayte0342
ChronoEdit-14B是NVIDIA开发的一款具备时间推理能力的图像编辑和世界模拟模型,拥有140亿参数。它通过两阶段推理过程实现物理感知的图像编辑和基于动作条件的世界模拟,从预训练视频生成模型中提炼先验知识。
valiantcat
Qwen-Image-Edit-Cosplay LoRA是基于Qwen-Image-Edit-2509图像编辑模型微调而来的动漫角色装扮迁移模型,专注于将动漫人物的发型、服饰和装饰道具精准迁移到真实人物图像上,同时保持原始人物的面部特征。
OPPOer
基于Qwen-Image-Edit进行模型剪枝的版本,移除了20层,保留40层权重,最终模型大小为13.6B参数。这是一个图像编辑模型,支持多图像输入和文本引导的图像合成与编辑。
dx8152
这是一个基于Qwen-Image-Edit的图像编辑Lora模型,专门用于白膜转材质等图像融合任务,表现非常出色。
这是一个基于Qwen-Edit模型的Lora图像融合工具,专门用于图像到图像的转换任务,能够实现出色的图像融合效果,特别擅长白膜转材质等图像编辑功能。
Qwen-Image-Edit-MeiTu是基于Qwen-Image-Edit的改进版本,采用DiT架构微调,专注于提升复杂图像编辑中的视觉一致性、美学质量和结构对齐能力。
ostris
这是一个基于Qwen-Image-Edit-2509的LoRA模型,专门用于将设计图案精准地应用到人物衬衫上,为图像编辑提供新的可能性。
cyburn
qwen_edit_photo_restore_v1-lora是一个基于Qwen-Image-Edit模型训练的LoRA适配器,专门用于图像编辑和修复任务。该模型使用AI Toolkit by Ostris进行训练,支持多种主流AI平台,提供高质量的图像处理能力。
flymy-ai
这是一个由FlyMy.AI开发的开源LoRA模型,专为Qwen-Image-Edit设计,专注于场景内图像编辑,通过低秩自适应技术增强对场景构图和对象定位的控制能力。
QuantStack
Qwen-Image-Edit-2509 GGUF是基于Qwen/Qwen-Image-Edit-2509模型转换的量化版本,专门用于图像到图像的处理任务。该模型保留了原模型的核心能力,支持在ComfyUI环境中进行图像编辑和处理。
calcuis
Qwen Image Edit Plus GGUF 是一个基于 Qwen 模型的图像编辑项目,提供多种运行方式,支持图像编辑和生成任务。该项目通过 GGUF 格式优化了模型部署和运行效率。
Qwen
通义图像编辑模型的月度迭代版本,支持多图像编辑,提升了单图像编辑的一致性,并原生支持ControlNet,为图像编辑带来更强大的功能和更好的效果。
FoxBaze
这是一个Alpha版本的LoRA模型,专门为Qwen图像编辑模型设计,用于执行多参考试穿编辑任务。该模型能够将多件下装服装试穿到主体图像上,生成风格化的试穿效果。
Qwen-Image是通义系列的多模态图像生成基础模型,在复杂文本渲染和精确图像编辑方面表现卓越,特别擅长中文文本渲染,支持多种图像生成和编辑任务。
OmniGen2
OmniGen2 是一个强大且高效的统一多模态模型,由 3B 视觉语言模型和 4B 扩散模型构成,支持视觉理解、文本到图像生成、指令引导的图像编辑和上下文生成。
RiverZ
这是一个基于LoRA技术的图像到图像转换模型,主要用于非商业用途的图像编辑任务。
ICEdit是一种创新的指令式图像编辑方法,通过大规模扩散变换器实现高效编辑,仅需0.5%的训练数据和1%的参数规模即可达到SOTA效果。
sanaka87
ICEdit是一种基于大规模扩散变换器的指令式图像编辑方法,仅需0.5%的训练数据和1%的参数即可实现最先进的编辑效果。
aihpi
基于Shuttle-3.1-Aesthetic构建的专用时尚图像编辑模型,擅长处理时尚相关的修改任务。
finetrainers
基于THUDM/CogView4-6B模型的图像编辑微调控制LoRA,支持通过文本指令对图像进行风格转换和内容编辑
adb-mcp是一个概念验证项目,旨在通过MCP协议为LLM提供接口,创建控制Adobe工具(如Photoshop和Premiere)的AI代理。该项目包含MCP服务器、Node命令代理服务器和Adobe应用插件,支持自然语言指令操作Adobe软件,适用于图像和视频编辑自动化。
基于Google Gemini 2.5 Flash API的MCP图像生成与编辑服务器,支持文本生成图像、图像编辑、迭代创作和风格迁移功能
一个基于OpenAI DALL-E API的MCP服务器,提供图像生成、编辑和变体功能,支持与Cline集成。
DALL-E MCP服务器是一个通过OpenAI的DALL-E API生成、编辑和创建图像变体的服务,支持与Cline集成,提供图像生成和处理功能。
Imagician是一个基于Model Context Protocol(MCP)的图像处理服务器,提供包括调整大小、格式转换、裁剪、压缩等多种图像编辑功能。
一个集成4o-image API的MCP服务器,支持通过文本生成和编辑图像。
Gemini Nanobanana MCP 是一个让用户通过文本描述生成AI图像的Claude插件,集成了Google Gemini 2.5 Flash图像生成功能,支持多种图像编辑和创作方式。
一个集成4o-image API的MCP服务器实现,支持通过标准化协议让LLM和AI系统生成和编辑图像,包括文本生成图像、图像编辑等功能。
GIMP-MCP项目旨在通过模型上下文协议(MCP)将GIMP与AI模型集成,提供智能图像编辑功能,如背景移除、图像修复等。
这是一个让用户通过自然语言对话控制GIMP图像编辑软件的MCP项目,将复杂的图像处理操作转化为简单的对话指令,支持从基础调整到高级特效的各种图像编辑功能。
该项目实现了一个MCP服务器,通过OpenAI的gpt-image-1模型提供图像生成和编辑功能,支持文本描述生成图像、基于参考图像编辑或修复图像,并可将结果保存到本地。
基于Google Gemini 2.5 Flash Image API的MCP服务器,提供文本生成图像、图像编辑、多图合成和风格转换等功能,支持多种MCP客户端使用。
Nano Banana是一个专业的MCP扩展,用于通过文本描述生成、编辑和修复图像,支持多种图像处理功能,如生成图标、图案、故事和图表等。
MAVAE是一个基于MCP协议的图像处理工具包,提供图像生成、编辑、集合管理等功能,支持AI代理标准化操作。