Nano Banana2 AI图像模型实现重大突破,攻克复杂细节还原难题,通过模拟人类多阶段创作流程,使图像生成从随机出图迈向可控精修,彻底解决文字、时间、光影等细节易出错的问题,引领行业进入精准生成新阶段。
谷歌Veo-3模型能生成逼真手术视频,但医学操作理解不足。测试中,AI根据手术图像预测8秒进展,使用SurgVeo标准评估50段真实手术视频。四位外科医生参与评测,发现模型在关键医学步骤上存在缺陷。
谷歌即将在未来几周发布AI图像生成模型Nano Banana2(代号GEMPIX2),其官网公告显示该模型由DeepMind团队开发,旨在提升图像创作效率和精准度,加速谷歌在生成式AI领域的创新进程。
英国法院就Getty Images诉Stability AI案作出裁决:Stability AI的图像生成模型使用Getty商标构成侵权,但未支持Getty的版权侵权主张,因被告未存储或复制受版权作品。
下一代AI图像生成和编辑模型,支持4K,超写实效果,控制精准
集成多AI模型,可通过对话生成图像、视频和声音,优化创意流程。
ArtAny AI整合多种AI模型,免费生成图像与视频,有热门优惠
统一的多模态AI,支持基于指令的图像编辑与生成,超越商业模型。
openai
-
输入tokens/百万
输出tokens/百万
128k
上下文长度
lichorosario
这是一个基于Qwen-Image模型训练的LoRA(Low-Rank Adaptation)模型,专门用于文本到图像的生成任务。该项目使用AI Toolkit训练,能够将文本描述转化为高质量的图像,支持在多种图像生成工具中使用。
Zlikwid
这是一个基于Qwen/Qwen-Image-Edit-2509基础模型训练的LoRA图像生成模型,专门用于图像到图像的转换任务,使用AI Toolkit by Ostris进行训练。
expert78
kontext-dusk-3-lora是一个基于FLUX.1-Kontext-dev基础模型训练的LoRA图像生成模型,专门用于生成黄昏蓝调时刻风格的图像。该模型通过特定触发词触发,支持多种主流AI图像生成工具使用。
zambawi
joywan-lora是基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频和图像生成任务,需要配合基础模型Wan-AI/Wan2.1-T2V-14B-Diffusers使用。
mrgant
lans_v1 - lora是基于Qwen/Qwen-Image模型使用AI Toolkit by Ostris训练的文本到图像转换模型,采用LoRA技术进行优化,具备良好的图像生成能力。
spamnco
这是一个基于Wan2.1-T2V-14B模型训练的LoRA适配器,专门用于文本到视频转换任务,为图像生成提供增强功能。该模型使用AI Toolkit训练,需要特定的触发词'diddly'来激活图像生成。
BarleyFarmer
pejawan22-lora是一个基于AI技术训练的LoRA模型,专门用于特定图像的生成,可与多种AI工具集成使用,通过触发词'peja'来生成图像。
natalie_wan_2.2-lora 是基于 AI Toolkit by Ostris 训练的 LoRA 模型,专门用于文本到视频转换任务,能够有效提升图像生成的质量和效果。
MartinSSSTSGH
这是一个基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频的图像生成任务,使用触发词'Lilly'来生成特定风格的图像内容。
Mark111111111
这是一个基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频转换,为图像生成带来新的体验。该模型需要配合基础模型Wan2.2-T2V-A14B使用。
Ashmotv
animat3d_style_wan-lora是基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频生成,可为图像生成带来独特的3D动画风格效果。该模型基于Wan2.2-T2V-A14B基础模型进行微调,支持多种主流AI平台使用。
Isshywondertwin
Alexis_Noir_Wan2.2-lora 是使用 AI Toolkit by Ostris 训练的 LoRA 模型,专门用于图像到视频转换任务。该模型基于 Wan2.2-I2V-A14B 基础模型,支持高分辨率图像生成。
andrewwe
my_qwennud-lora是基于Qwen-Image-Edit-2509使用特定工具训练的LoRA模型,专门用于图像生成和编辑任务,采用AI Toolkit by Ostris训练而成,可与多种主流AI工具配合使用。
bigdoinks420518
这是一个使用AI Toolkit by Ostris训练的LoRA模型,基于Wan-AI/Wan2.1-T2V-14B-Diffusers基础模型,主要用于文本到视频生成,在图像生成领域有独特应用价值。
deadpoolx22
这是一个基于AI技术的文本到视频LoRA模型,专门针对alita角色进行优化训练,可用于图像生成等场景,为相关领域的应用提供了便利。
jude1903
AJWWan22-lora 是一个基于文本生成视频的LoRA模型,通过AI Toolkit进行训练,专门用于图像生成任务。该模型需要特定的触发词来激活生成功能。
fraemwerk
这是一个基于Wan2.1-T2V-14B模型的文本到视频LoRA适配器,使用AI Toolkit训练,专注于图像生成任务,需要特定触发词'fraemwerk'来激活生成功能。
这是一个基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频的转换任务。模型基于Wan2.2-T2V-A14B架构,支持高分辨率图像生成。
xreborn
ohwx2_wan-lora是一个基于文本生成视频的LoRA模型,使用AI Toolkit训练,专门用于图像生成任务,需要特定触发词'ohwx girl'来激活生成效果。
zac
这是一个基于AI Toolkit by Ostris训练的LoRA模型,专门用于图像到视频转换任务,为图像生成提供了新的解决方案。该模型基于Qwen/Qwen-Image基础模型构建,使用John作为触发词来生成图像。
mcp-hfspace是一个连接Hugging Face Spaces的MCP服务器,支持图像生成、语音处理、视觉模型等多种AI功能,简化了与Claude Desktop的集成。
AI视频生成MCP服务器,支持文本和图像输入生成动态视频,提供多种参数控制和模型选择。
OpenSCAD MCP服务器是一个通过文本或图像生成参数化3D模型的服务,支持多视角重建、AI图像生成、远程CUDA处理和工作流审批,最终输出OpenSCAD兼容的模型文件。
MCPollinations是一个基于Model Context Protocol(MCP)的多模态AI服务,支持通过Pollinations API生成图像、文本和音频。它提供无需认证的轻量级服务,兼容多种AI模型,并支持图像保存和Base64编码返回。
Outsource MCP是一个支持多AI模型提供商的统一接口服务,通过MCP协议让AI应用能便捷调用不同厂商的文本和图像生成能力。
DiffuGen是一个先进的本地图像生成工具,集成了MCP协议,支持多种AI模型(包括Flux和Stable Diffusion系列),可直接在开发环境中生成高质量图像。它提供了灵活的配置选项、多GPU支持,并可通过MCP协议与多种IDE集成,同时提供OpenAPI接口供外部调用。
Moondream MCP Server是一个基于Moondream视觉模型的图像分析服务,提供图像描述生成、物体检测和视觉问答功能,可轻松集成到Claude和Cline等AI助手中。
一个基于OpenSCAD的MCP服务器,通过AI生成多视角图像并重建为参数化3D模型,支持远程CUDA加速处理。
一个用于对接Replicate API的FastMCP服务器实现,提供标准化接口访问多种AI模型,目前支持图像生成功能,处于早期开发阶段。
一个基于Replicate API的FastMCP服务器实现,专注于提供资源化的AI模型推理访问,特别擅长图像生成功能。
DiffuGen是一个先进的本地图像生成工具,集成了MCP协议,支持多种AI模型,可在开发环境中无缝生成高质量图像。
Gemini MCP服务器是一个为Claude桌面应用设计的中间件,通过Google Gemini AI模型实现图像生成功能。该项目提供便捷的安装配置向导,支持Docker容器化部署,并允许用户自定义生成参数。
MCP Flux Studio是一个强大的模型上下文协议服务器,将Flux的高级图像生成功能集成到AI编程助手中,支持Cursor和Windsurf IDE。
Replicate Flux MCP是一个基于Model Context Protocol(MCP)的高级服务器,通过Replicate API利用Flux Schnell和Recraft V3 SVG模型,为AI助手提供高质量的图像和矢量图形生成能力。
基于Amazon Bedrock Nova Canvas模型的AI图像生成MCP服务
Image Gen MCP Server是一个通用AI图像生成服务,通过Model Context Protocol(MCP)标准协议为各类LLM聊天机器人提供跨平台、多模型的图像生成能力,支持OpenAI和Google的多种图像模型,实现文本对话到可视化内容的无缝转换。
Model Context Protocol (MCP) 是一个开源协议,提供了一系列参考实现和社区开发的服务器,旨在为大型语言模型(LLM)提供安全、可控的工具和数据源访问。这些服务器展示了MCP的多样性和可扩展性,涵盖了从文件系统操作到数据库集成、从网络搜索到AI图像生成等多种功能。
Flux ImageGen MCP Server是一个基于Model Context Protocol (MCP)的专用服务器,专注于通过Pollinations AI提供图像生成和处理功能。它支持从文本提示生成图像URL、直接生成图像以及管理多种图像生成模型。
Gaia MCP Server是一个基于Model Context Protocol(MCP)的服务器实现,支持通过stdio和SSE两种方式与大型语言模型(LLM)进行通信,提供标准化的工具调用接口,特别集成了AI图像生成和处理功能。
一个基于Amazon Bedrock Nova Canvas模型的MCP服务器,提供高质量的AI图像生成服务,支持文本描述生成图像、负面提示优化、尺寸配置和种子控制等功能。