Adobe发布专业级AI图像生成模型Firefly Image5,实现从“够用”到专业级的质变。新功能包括原生400万像素输出、分层提示编辑、自定义艺术风格模型及AI语音配乐生成,打通图像、视频、音频的AI创作闭环,重新定义创意工作流。
谷歌Gemini Canvas推出新功能,可根据提示词或文件快速生成PPT,旨在提升学生和职场人士的制作效率。操作简便,用户输入提示即可自动生成幻灯片。
OpenAI正开发AI音乐生成工具,可根据文本或音频提示创作音乐,拓展多模态内容生成能力。主要聚焦视频配乐和精准伴奏,支持为视频定制背景音乐等实用场景。
Snapchat免费开放AI图像生成工具“Imagine Lens”,所有用户均可通过文本提示编辑或生成图片。此举旨在应对Meta AI和OpenAI等对手在AI视频领域对年轻用户的竞争,工具原为付费功能,现转为全民创作服务。
Director是Browserbase的无代码工具,可根据提示创建可重复的网页自动化操作。
提供优质图像生成提示词,浏览模板一键复制创作惊艳图像
免费AI Sora 2提示生成器,将想法转化为专业视频提示
Nano Banana驱动的复古图像提示生成器,可创作复古AI艺术
nvidia
-
Input tokens/M
Output tokens/M
128k
Context Length
anthropic
$108
$540
200k
noctrex
这是PromptCoT-2.0-SelfPlay-30B-A3B模型的MXFP4_MOE量化版本,专门用于文本生成任务。该模型采用了思维链提示和自博弈训练技术,通过量化优化实现了更高效的推理性能。
stablellama
这是一个基于Qwen/Qwen-Image模型的LyCORIS适配器,专门用于文本到图像和图像到图像的生成任务。该模型在训练过程中未使用验证提示,采用了优化的训练配置和量化技术。
neuralvfx
LibreFLUX-ControlNet是一个基于ControlNet架构的文本到图像生成模型,使用LibreFLUX作为基础Transformer模型。该模型在SA1B数据集上进行训练,能够根据文本提示和控制图像生成高质量的图像内容。
EpistemeAI
这是第一代强大的vibe-code大语言模型,经过优化可直接根据结构松散的'氛围编码'提示生成自然语言和代码补全。相比早期模型,它具有更低的提示工程开销、更平滑的潜在空间插值,更容易引导生成可用代码。
Lambent
Mira是一个基于多个Gemma 3 27B基础模型融合的文本生成模型,通过精心挑选的训练数据和特定训练方式,具备独特的诗意文本生成能力。该模型在角色扮演和创意写作方面表现出色,能够根据不同的系统提示生成富有文学色彩的文本。
nunchaku-tech
基于sdxl-turbo经过Nunchaku量化处理的文本到图像生成模型,旨在根据文本提示生成高质量图像。该模型针对高效推理进行了优化,在保持性能的同时显著减小模型大小。
gtmepm
simpletuner-lora 是一个基于 stabilityai/stable-diffusion-3.5-medium 的 LyCORIS 适配器,专门用于文生图等图像生成任务。该模型通过 LoRA 微调技术实现,主要使用验证提示为'A photo-realistic image of a cat'进行训练。
Alissonerdx
HuMo是一个统一的、以人为中心的视频生成框架,能够根据文本、图像和音频等多模态输入,生成高质量、细粒度且可控的人类视频。它支持强大的文本提示跟随、一致的主体保留以及同步的音频驱动运动。
VeryAladeen
HuMo是一个以人为中心的视频生成框架,能够利用文本、图像和音频等多模态输入生成高质量、细粒度且可控的人类视频,支持文本提示跟随、主体保留和音频驱动运动同步。
Wan-AI
Wan2.2-S2V-14B是一个专为音频驱动的电影级视频生成而设计的混合专家(MoE)模型。它能够根据输入的音频、参考图像和文本提示生成高质量的视频内容,支持480P和720P分辨率,并具备复杂运动生成和电影级美学效果。
camenduru
FLUX.1 [dev] 是一个具有120亿参数的整流流变压器,专门用于文本到图像生成。它在图像生成质量方面表现卓越,仅次于FLUX.1 [pro],具有出色的提示跟随能力和高效的训练方式,为科研和创作提供强大支持。
John6666
Intorealism XL 是一款强大的文本到图像生成模型,能够生成逼真、细腻的图像,涵盖人像、风景等多种主题,在光影、纹理等方面表现出色,严格遵循输入提示进行图像创作。
InvokeAI
FLUX.1 Krea [dev] 是一个拥有120亿参数的先进整流流变换器模型,专门用于根据文本描述生成高质量图像。该模型在美学摄影领域表现卓越,具有出色的提示遵循能力,采用引导蒸馏技术训练,并开放权重供非商业用途使用。
Colossus Project Flux 的 Nunchaku 量化版本,旨在根据文本提示生成高质量图像。该模型在优化推理效率的同时,将性能损失降至最低。
Acly
MobileSAM是一款轻量级的图像分割模型,能够根据点或框提示生成目标掩码,专为在消费级硬件上进行高效推理而设计。
这是一个经过Nunchaku量化的SANA-1.6B模型版本,专门用于根据文本提示生成高质量图像。该模型通过先进的SVDQuant量化技术,在保持生成质量的同时显著优化了推理效率,适用于各种文本到图像的生成任务。
Nunchaku 量化的 FLUX.1-dev 模型,用于根据文本提示生成高质量图像,优化了推理效率。
sriprabha
这是一个基于FLUX.1-schnell的LyCORIS适配器,专门用于文本到图像生成任务。该模型通过LoRA技术进行微调,在训练过程中未使用验证提示,文本编码器未进行训练,可复用基础模型的文本编码器进行推理。
Roblox
RoGuard 1.0 是一款基于 Llama-3.1-8B-Instruct 微调的先进大语言模型,专门用于为大语言模型提供安全保障。它能够在提示和回复两个层面进行安全分类,判断输入或输出是否违反安全政策,为文本生成API提供强大的安全护栏。
Roblox Guard 1.0是一款基于Llama-3.1-8B-Instruct微调的最先进指令微调大语言模型,专门设计用于保护文本生成API的安全。它能够在提示词和回复层面进行双级安全分类,有效审核用户查询和模型输出,确保内容符合安全政策。
一个基于Model Context Protocol (MCP)的服务,支持规范驱动的开发流程,通过结构化提示引导开发者从需求生成、设计文档到代码实现的系统化开发过程。
AI Studio MCP Server是一个集成Google AI Studio/Gemini API的模型上下文协议服务器,提供支持文件、对话历史和系统提示的内容生成功能。
该项目是一个基于Google Veo2模型的视频生成MCP服务器,支持通过文本提示或图像生成视频,并提供MCP资源访问功能。
一个基于FastMCP框架的服务器,通过远程Comfy服务器根据提示生成图像。
该项目是一个基于FastMCP库构建的Kaggle MCP服务器,提供搜索和下载Kaggle数据集的功能,并能生成EDA笔记本提示。
一个基于MCP协议的图像生成服务器,使用Replicate的flux-schnell模型,支持通过文本提示生成图像,并可配置多种参数。
一个基于TypeScript的MCP服务器,使用OPENAI的dall-e-3模型根据文本提示生成图像,并支持将生成的图像保存到本地指定目录。
oatpp-mcp是基于Oat++框架实现的Anthropic模型上下文协议(MCP),支持自动生成API工具、STDIO和HTTP SSE传输方式,以及提示、资源和工具等服务器功能。
一个基于Git仓库内容生成提示的MCP服务器
cal2prompt是一个命令行工具,可将Google日历日程转换为自定义提示或文本片段,支持模板引擎和MCP服务器模式。
MCP图像生成器是一个基于Together AI或Replicate的图像生成服务,支持通过SSE端点或本地运行,提供根据文本提示生成图像的功能。
Image Generation MCP Server是一个为Claude Desktop提供图像生成功能的MCP服务器,使用Replicate Flux模型,支持通过文本提示生成图像,并可通过Smithery或npm安装配置。
Roblox Studio MCP服务器是一个专为Roblox Studio开发设计的TypeScript实现,提供资源、工具和提示,支持LLM应用程序通过标准化接口访问Roblox Studio文档、模板和代码生成功能。
一个基于OpenAI GPT-4o/gpt-image-1模型的图像生成与编辑工具,支持通过文本提示生成图像、编辑图像(如修复、扩展、合成等),并兼容多种MCP客户端。
Lucidity是一个模型上下文协议(MCP)服务器,旨在通过智能提示分析提升AI生成代码的质量。它提供结构化指导,帮助识别和解决代码质量问题,支持多种编程语言,并能与AI助手无缝集成。
OracleDB MCP Server是一个提供Oracle数据库表/列上下文给LLM的服务器,支持通过LLM提示与数据库交互、生成SQL语句并返回结果。
ComfyUI的MCP服务,提供图像生成和提示词优化功能,支持自动调整尺寸和随机种子生成。
一个基于Rust库的MCP服务器,用于从代码库生成上下文提示,帮助AI助手更好地理解和处理代码仓库。
LetzAI MCP 是一个用于图像生成的模型上下文协议,通过 Claude 桌面应用集成,支持基于提示词生成和放大图像。