最好的Image AI工具模型_精选Image资讯

5.4k

Free AI Image Generator

免费AI图像生成器，无需注册，可从文本无限生成图像

8.2k

Nano Banana Pro | Build with the Next

基于Gemini 3 Pro Image的AI图像生成器，支持文本渲染和4K画质

6.4k

Nano Banana Pro & 2.0 AI | Google's Image Editor by Gemini 3 Pro

专业AI图像生成与编辑器，2-5秒产出2K/4K高质量图像，支持多语言

4.2k

模型

WEBGEN Devstral 24B

Tesslate

WEBGEN DEVSTRAL IMAGES 是一个专注于网页生成的人工智能模型，能够利用 HTML、CSS、JS 和 Tailwind 技术生成单页式网页。该项目基于自定义模板进行训练，采用监督微调方法，使用 GPT-OSS-120B 生成的数据集进行训练。

Qwen Image Edit Plus Gguf

calcuis

Qwen Image Edit Plus GGUF 是一个基于 Qwen 模型的图像编辑项目，提供多种运行方式，支持图像编辑和生成任务。该项目通过 GGUF 格式优化了模型部署和运行效率。

Simpletuner Lora

gtmepm

simpletuner-lora 是一个基于 stabilityai/stable-diffusion-3.5-medium 的 LyCORIS 适配器，专门用于文生图等图像生成任务。该模型通过 LoRA 微调技术实现，主要使用验证提示为'A photo-realistic image of a cat'进行训练。

NetaYume Lumina Image 2.0 GGUF

Immac

NetaYume Lumina Image 2.0 是一个文本到图像的扩散模型，经过GGUF格式量化处理，能够将文本描述转换为图像。该模型经过优化，在保持生成质量的同时减少了内存使用和提升了性能。

Rope_vit_reg4_b14_capi Imagenet21k

birder-project

采用RoPE的ViT图像分类模型，经过CAPI预训练和ImageNet-21K微调，适用于图像分类和检测任务。

计算机视觉

Pytorch

birder-project

Images 3Dmodel

gordon-0115

一个实验性的自然语言到3D模型生成流程，基于改进的预训练多视角扩散模型

多模态

Diffusers

gordon-0115

Rdnet_tiny.nv_in1k

naver-ai

一个轻量级的RDNet图像分类模型，在ImageNet-1k数据集上训练，参数量24M，top-1准确率82.8%。

Imagecaptioning4

eduardo-bolognini

这是一个托管在Hugging Face Hub上的transformers模型，具体功能和用途尚未明确说明。

自然语言处理

Transformers

eduardo-bolognini

VMamba_ImageNet_82.6

saurabhati

VMamba 是一个基于双向状态空间模型的视觉模型，专为图像分类任务设计，在 ImageNet 数据集上微调。

Image_captioning

eduardo-bolognini

这是一个托管在Hugging Face Hub上的transformers模型，具体功能和用途需要进一步补充信息

Mar Vae Kl16

xwen99

这是一个基于ImageNet-1k数据集训练的KL16变分自编码器(VAE)模型，用于图像到图像的转换任务。

计算机视觉

Diffusers

xwen99

Fairface_age_image_detection

dima806

基于Vision Transformer架构的图像分类模型，在ImageNet-21k数据集上预训练，适用于多类别图像分类任务

TRELLIS Image Large

microsoft

TRELLIS Image Large是一个大型3D生成模型TRELLIS的图像条件版本，能够依据输入图像生成3D内容。

Cute Kawaii

imagepipeline

FLUX.1-dev是一个基于文生图技术的超写实风格图像生成模型，支持LoRA微调，适用于图像处理管线。

计算机视觉

Diffusers

imagepipeline

Flux Anime

imagepipeline

FLUX.1-dev 是一个基于 diffusers 库的图像生成模型，专注于文生图任务，支持超现实风格和动漫风格的图像生成。

Image_Captioning_Model

premanthcharan

结合视觉变换器(ViT)与自然语言处理的图像描述生成模型，能够自动为输入图像生成自然语言描述

多模态

Pytorch

premanthcharan

ImagePromptHelper Danube3 500M

trollek

这是一个基于h2oai/h2o-danube3-500m-base微调的图像提示生成模型，专门用于将简短的自然语言描述转换为详细、高质量的图像生成提示词。支持多种风格输出，包括详细描述、Danbooru标签风格和混合风格。

Kat_tiny_patch16_224.vitft

adamdad

KAT是一种采用分组有理科尔莫戈罗夫-阿诺德网络（GR-KAN）替代传统Transformer中通道混合器的新型视觉模型，在ImageNet-1k数据集上训练。

Florence 2 Large Ft Moredetailed

yayayaaa

基于Florence-2-large-ft模型在imageinwords数据集上微调，专注于生成更详细的图片描述

Vit Facial Expression Recognition

Alpiyildo

基于ViT架构的面部表情识别模型，在imagefolder数据集上微调，准确率达91.77%

MCP

FAL AI Image Generation

一个基于FAL AI的Logo生成服务器，提供图像生成、背景去除和自动缩放功能。

14.3k

4.2分

Image Gen Server

基于即梦AI的图像生成服务，专为Cursor IDE设计，实现文本描述到图像的生成与保存。

15.6k

4.0分

Image Description Mcp_server

一个基于xAI Grok API的MCP服务器，提供AI图像分析功能，支持URL和本地文件的图像描述、元数据提取和OCR文字识别

Image Generation (Flux Schnell)

一个基于MCP协议的图像生成服务器，使用Replicate的flux-schnell模型，支持通过文本提示生成图像，并可配置多种参数。

10.3k

Image Downloader

一个支持图片下载和处理的MCP服务器，提供批量下载、格式转换、尺寸调整和压缩等功能

javascript

9.1k

DALL E 3 Image Generator

一个基于TypeScript的MCP服务器，使用OPENAI的dall-e-3模型根据文本提示生成图像，并支持将生成的图像保存到本地指定目录。

9.1k

OpenAI Image Generator

一个基于OpenAI GPT-4o/gpt-image-1模型的图像生成与编辑工具，支持通过文本提示生成图像、编辑图像（如修复、扩展、合成等），并兼容多种MCP客户端。

9.7k

Image Generation MCP Server

Image Generation MCP Server是一个为Claude Desktop提供图像生成功能的MCP服务器，使用Replicate Flux模型，支持通过文本提示生成图像，并可通过Smithery或npm安装配置。

7.6k

Clipboard Image

一个用于获取剪贴板内容的MCP服务器，目前仅支持MacOS系统上的图像内容。

9.1k

Image Mcp Server

一个基于GPT-4o-mini模型的图像分析MCP服务器，可处理URL或本地路径的图像内容分析

8.9k

Image Generator (OpenAI)

一个允许Claude与OpenAI对话并使用gpt-image-1生成图像资产的工具，适用于游戏或网页开发中需要生成单个资产的场景。

6.3k

Image Download and Optimize

一个基于MCP协议的图像下载与优化服务

7.6k

Image Gen Mcp

一个基于Stable Diffusion WebUI API的文本生成图像MCP服务器

9.2k

Image Processor

一个提供图像获取和处理功能的MCP服务器，支持从URL、本地路径和numpy数组加载图像，并返回base64编码的字符串和MIME类型。

9.4k

Grok Image Generator

Grok AI图像生成MCP服务器项目，支持通过Docker容器化部署，提供多图生成与多种返回格式支持。

8.6k

Image Process Mcp Server

一个基于Sharp库的图片处理MCP服务，提供调整尺寸、格式转换、裁剪、旋转和获取图片信息等功能

8.2k

Read Images

一个基于OpenRouter视觉模型的MCP图像分析服务器

javascript

8.2k

Ghibli Mcp Video Server

基于TypeScript的MCP服务器，提供AI图像和视频生成功能，需要GPT4O Image Generator的API密钥支持。

6.2k

Ghibli Video Generator

一个基于TypeScript的MCP服务器，提供AI图像和视频生成功能，需GPT4O Image Generator的API密钥支持。

9.2k