蚂蚁灵光App上线“体验世界模型”功能,成为业界首个移动端AGI产品。用户上传一张图片,即可在手机上最长60秒探索3D世界,支持手游式视角操控,从触发到探索仅需秒级。这是业内首次在端侧实现世界模型,具备分钟级长时一致性与实时交互能力。
淘宝天猫推出全新售后AI假图识别模型,专门识别用户利用AI技术伪造破损污渍图片、恶意申请退款的行为。该功能旨在维护商家合法权益,减少因虚假售后凭证造成的损失。随着电商发展,AI生成图像的欺诈现象增多,此模型将有效遏制此类问题。
Claude Design是Anthropic推出的实验性产品,用户通过文字、图片或文档即可生成专业设计稿、原型、演示文稿等,大幅降低视觉内容创作门槛。这标志着Claude从单一对话模型向多模态生产力工具加速演进。
NVIDIA开源Lyra2.0框架,可从单张图像生成持久一致的大型3D场景,支持实时渲染与机器人仿真,为游戏开发和虚拟环境构建提供新工具。
由 GPT Image 2 驱动的 4K 高清 AI 图像生成与商用素材创作平台。
OpenAI下一代AI图像生成模型,可免费在线试用,用于多类型视觉创作。
全球首款由 Google Nano Banana 2 驱动的超高清 4K 图像生成平台。
一站式AI视频与图像创作工作室,支持多种模型,可文本、图像生成音视频。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
Baidu
128
$2
$20
$6
$24
starsfriday
这是一个基于 Qwen/Qwen-Image 训练的人像生成模型,专门用于生成中国古风风格的动漫图片。该模型通过 LoRA 技术微调,能够生成具有传统东方美学特征的数字艺术作品。
ByteDance
InfiniteYou(InfU)是一个基于FLUX扩散变换器(DiT)的身份保持图像生成框架,能够在保持身份特征的同时实现灵活的图片重塑。
Keltezaa
基于FLUX.1-dev基础模型定制的LoRA模型,专注于生成高质量的女性形象图片,特别是名人风格的肖像。
DeZoomer
基于AI-Toolkit (Flux.1开发版)训练的文本生成图像模型,使用20张公开图片进行本地训练,专注于角色特征还原。
punzel
基于25张比莉·艾利什图片训练的LoRA模型,无需触发词即可生成比莉·艾利什风格的图像
基于25张麦迪逊·比尔图片训练的LoRA模型,无需触发词即可生成相关风格图像
yayayaaa
基于Florence-2-large-ft模型在imageinwords数据集上微调,专注于生成更详细的图片描述
nnpy
这是一个基于 BLIP 架构的图像描述生成模型,能够为输入的图片生成简洁的文字描述。
DeepFloyd
DeepFloyd-IF是一款基于像素的文本到图像三级级联扩散模型,能够生成具有新突破的写实风格与语言理解能力的图片。
Guizmus
一个基于Stable Diffusion 1.5的文本生成图像模型,专为Discord上的'每周图片'比赛设计,旨在通过艺术表达情感和故事。
faalbane
这是一个基于Stable Diffusion v1.5微调的Dreambooth模型,使用21张训练图片训练而成,用于生成特定风格的图像。
joyc360
基于HuggingPics生成的图像分类模型,用于区分深度伪造图片和真实图片
tuman
这是一个基于COCO2014数据集翻译版(英俄)训练的图片描述生成模型,能够为输入的图像生成俄语描述。
JosephusCheung
专为二次元爱好者打造的潜在扩散模型,能通过简单提示生成高质量、高细节的动漫风格图片
3ee
基于F222微调的稳定扩散模型,专注于生成装饰风格的圣诞老人图像,包含200多张训练图片。
基于马赛克艺术图片训练的Dreamboothed稳定扩散模型,可生成马赛克艺术风格的图像。
ringhyacinth
这是一个基于美甲套装图片微调的Stable Diffusion模型,可用于生成各种风格的美甲设计。
osanseviero
一个基于HuggingPics生成的图像分类模型,能够准确区分羊驼和土豆的图片。
一个基于MCP服务器的PowerPoint演示文稿生成项目,支持创建、编辑和保存演示文稿,包含多种幻灯片类型和图表生成功能。
该项目是一个基于MCP协议和python-pptx库的PPT制作服务,支持通过聊天交互动态创建、编辑和保存PowerPoint演示文稿,提供添加幻灯片、图片、表格等多种功能,并能生成下载链接和导出为Base64格式。
Placid.app MCP服务器是一个用于与Placid.app API集成的服务实现,提供模板管理和多媒体生成功能。
基于MCP协议的Flux Schnell图片生成服务器,通过Replicate API实现AI绘图功能
一个提供多种占位图片生成服务的MCP服务器
ComfyUI-AnimaTool是一个让AI Agent直接生成二次元图片并原生显示在聊天窗口的工具,通过MCP协议或HTTP API连接ComfyUI,支持结构化提示词、多长宽比、批量生成和LoRA加载等功能。
基于火山引擎SeeDream模型的MCP图片生成工具,支持高质量图片生成、自定义尺寸和智能参考图,可通过MCP协议在Cursor、Claude Desktop等客户端中使用。
Ideogram MCP Server是一个基于Ideogram API的图片生成服务,提供多种可定制的图片生成参数,包括比例、模型、风格等。
一个基于MCP服务器的PowerPoint演示文稿生成项目,支持通过API调用Stable Diffusion生成图片,并提供多种幻灯片模板和编辑功能。
自动生成完整网站图标集的MCP服务,支持从PNG图片或URL创建多种尺寸的favicon、苹果触摸图标及网页应用清单文件。
基于火山引擎即梦AI的图片生成MCP服务,提供标准化接口生成高质量图片,支持多种比例和自定义参数。
一个基于MCP平台的本地代理服务器和客户端实现,集成天气查询、谷歌搜索、摄像头控制、图片生成和智能对话等多种AI工具功能,支持模块化扩展和高性能并发处理。
Word MCP Server是一个基于Python的API服务,用于通过FastMCP框架创建和编辑Word文档,支持文本格式化、图片插入和表格生成等功能。
基于Together AI的图像生成服务,集成Cursor MCP,支持多种宽高比和批量生成的高质量图片生成工具。
基于MCP协议的小红书图文内容生成工具,提供智能大纲生成、图片生成和项目管理功能
基于Ideogram API的图片生成MCP服务器
一个通过Replicate的FLUX模型生成图片并存储到Cloudflare R2的MCP服务器
基于GLM-4.5V模型的MCP服务器,提供智能图片分析功能,支持从文件路径或剪贴板获取图片,专门用于代码内容提取、架构分析、错误检测和文档生成。
一个基于多API的图片搜索与图标生成服务,专为Cursor IDE设计,提供图片搜索、下载及AI生成图标功能
Yandex Maps MCP Server是一个为Yandex地图API提供服务的中间件,包含地理编码、反向地理编码和地图渲染功能,支持通过地址获取坐标或通过坐标获取地址,并能生成地图图片。