伦敦高等法院裁定Stable Diffusion训练AI模型不构成版权侵权。Getty Images曾指控其抓取数百万版权照片威胁创意产业,但最终放弃主要诉求。案件焦点在于使用版权图像训练AI是否侵权,裁决对AI开发与版权平衡具重要意义。
英国高等法院驳回Getty Images对Stability AI的版权诉讼,成为生成式AI领域重要判例。案件核心争议在于使用受版权图片训练AI模型是否侵权。Getty指控对方未经授权抓取其数百万照片训练Stable Diffusion模型,称此举威胁创意产业生存。目前案件仍在推进中。
英国法院就Getty Images诉Stability AI案作出裁决:Stability AI的图像生成模型使用Getty商标构成侵权,但未支持Getty的版权侵权主张,因被告未存储或复制受版权作品。
人工智能公司Perplexity与Getty Images达成多年图片授权协议,将在其AI搜索工具中使用Getty的图片。这标志着Perplexity从过去因内容抓取和抄袭争议(如被指控盗用Getty图片)向建立正式合法内容合作的重要战略转变。
免费AI图像编辑器和生成器,由Nano Banana AI驱动,功能强大无限制。
免费AI图像生成器,无需注册,可从文本无限生成图像
基于Gemini 3 Pro Image的AI图像生成器,支持文本渲染和4K画质
专业AI图像生成与编辑器,2-5秒产出2K/4K高质量图像,支持多语言
Tesslate
WEBGEN DEVSTRAL IMAGES 是一个专注于网页生成的人工智能模型,能够利用 HTML、CSS、JS 和 Tailwind 技术生成单页式网页。该项目基于自定义模板进行训练,采用监督微调方法,使用 GPT-OSS-120B 生成的数据集进行训练。
calcuis
Qwen Image Edit Plus GGUF 是一个基于 Qwen 模型的图像编辑项目,提供多种运行方式,支持图像编辑和生成任务。该项目通过 GGUF 格式优化了模型部署和运行效率。
gtmepm
simpletuner-lora 是一个基于 stabilityai/stable-diffusion-3.5-medium 的 LyCORIS 适配器,专门用于文生图等图像生成任务。该模型通过 LoRA 微调技术实现,主要使用验证提示为'A photo-realistic image of a cat'进行训练。
Immac
NetaYume Lumina Image 2.0 是一个文本到图像的扩散模型,经过GGUF格式量化处理,能够将文本描述转换为图像。该模型经过优化,在保持生成质量的同时减少了内存使用和提升了性能。
birder-project
采用RoPE的ViT图像分类模型,经过CAPI预训练和ImageNet-21K微调,适用于图像分类和检测任务。
gordon-0115
一个实验性的自然语言到3D模型生成流程,基于改进的预训练多视角扩散模型
naver-ai
一个轻量级的RDNet图像分类模型,在ImageNet-1k数据集上训练,参数量24M,top-1准确率82.8%。
eduardo-bolognini
这是一个托管在Hugging Face Hub上的transformers模型,具体功能和用途尚未明确说明。
saurabhati
VMamba 是一个基于双向状态空间模型的视觉模型,专为图像分类任务设计,在 ImageNet 数据集上微调。
这是一个托管在Hugging Face Hub上的transformers模型,具体功能和用途需要进一步补充信息
xwen99
这是一个基于ImageNet-1k数据集训练的KL16变分自编码器(VAE)模型,用于图像到图像的转换任务。
dima806
基于Vision Transformer架构的图像分类模型,在ImageNet-21k数据集上预训练,适用于多类别图像分类任务
microsoft
TRELLIS Image Large是一个大型3D生成模型TRELLIS的图像条件版本,能够依据输入图像生成3D内容。
imagepipeline
FLUX.1-dev是一个基于文生图技术的超写实风格图像生成模型,支持LoRA微调,适用于图像处理管线。
FLUX.1-dev 是一个基于 diffusers 库的图像生成模型,专注于文生图任务,支持超现实风格和动漫风格的图像生成。
premanthcharan
结合视觉变换器(ViT)与自然语言处理的图像描述生成模型,能够自动为输入图像生成自然语言描述
trollek
这是一个基于h2oai/h2o-danube3-500m-base微调的图像提示生成模型,专门用于将简短的自然语言描述转换为详细、高质量的图像生成提示词。支持多种风格输出,包括详细描述、Danbooru标签风格和混合风格。
adamdad
KAT是一种采用分组有理科尔莫戈罗夫-阿诺德网络(GR-KAN)替代传统Transformer中通道混合器的新型视觉模型,在ImageNet-1k数据集上训练。
yayayaaa
基于Florence-2-large-ft模型在imageinwords数据集上微调,专注于生成更详细的图片描述
Alpiyildo
基于ViT架构的面部表情识别模型,在imagefolder数据集上微调,准确率达91.77%
一个基于FAL AI的Logo生成服务器,提供图像生成、背景去除和自动缩放功能。
基于即梦AI的图像生成服务,专为Cursor IDE设计,实现文本描述到图像的生成与保存。
一个基于xAI Grok API的MCP服务器,提供AI图像分析功能,支持URL和本地文件的图像描述、元数据提取和OCR文字识别
一个基于MCP协议的图像生成服务器,使用Replicate的flux-schnell模型,支持通过文本提示生成图像,并可配置多种参数。
一个支持图片下载和处理的MCP服务器,提供批量下载、格式转换、尺寸调整和压缩等功能
一个基于TypeScript的MCP服务器,使用OPENAI的dall-e-3模型根据文本提示生成图像,并支持将生成的图像保存到本地指定目录。
一个基于OpenAI GPT-4o/gpt-image-1模型的图像生成与编辑工具,支持通过文本提示生成图像、编辑图像(如修复、扩展、合成等),并兼容多种MCP客户端。
Image Generation MCP Server是一个为Claude Desktop提供图像生成功能的MCP服务器,使用Replicate Flux模型,支持通过文本提示生成图像,并可通过Smithery或npm安装配置。
一个用于获取剪贴板内容的MCP服务器,目前仅支持MacOS系统上的图像内容。
一个基于GPT-4o-mini模型的图像分析MCP服务器,可处理URL或本地路径的图像内容分析
一个允许Claude与OpenAI对话并使用gpt-image-1生成图像资产的工具,适用于游戏或网页开发中需要生成单个资产的场景。
一个基于MCP协议的图像下载与优化服务
一个基于Stable Diffusion WebUI API的文本生成图像MCP服务器
一个提供图像获取和处理功能的MCP服务器,支持从URL、本地路径和numpy数组加载图像,并返回base64编码的字符串和MIME类型。
Grok AI图像生成MCP服务器项目,支持通过Docker容器化部署,提供多图生成与多种返回格式支持。
一个基于Sharp库的图片处理MCP服务,提供调整尺寸、格式转换、裁剪、旋转和获取图片信息等功能
一个基于OpenRouter视觉模型的MCP图像分析服务器
基于TypeScript的MCP服务器,提供AI图像和视频生成功能,需要GPT4O Image Generator的API密钥支持。
一个基于TypeScript的MCP服务器,提供AI图像和视频生成功能,需GPT4O Image Generator的API密钥支持。
基于Ideogram API的图片生成MCP服务器