谷歌下一代AI模型Gemini 3.5遭泄露,代号Snow Bunny的内部测试版展现出强大工程能力,可一次性构建完整应用程序,支持单次提示生成多达3000行可运行代码。谷歌还准备了多个专项模型,如专攻特定领域的Fierce Falcon,显示其在编程领域的重大突破。
深度求索计划于2月中旬推出新一代旗舰模型DeepSeek-V4,重点提升代码生成和长代码上下文处理能力。该模型在内部测试中表现已超越Claude和GPT系列,尤其在长代码提示处理方面优势明显。
近日,Google Gemini和OpenAI的ChatGPT等生成式AI工具被曝遭恶意利用,用户通过特定提示词绕过安全审查,将正常照片中的女性篡改为暴露的“深伪”图像。相关教程曾在Reddit等平台传播,引发对AI安全边界的担忧。
瑞典AI初创公司Lovable完成3.3亿美元B轮融资,估值达66亿美元,较7月增长超三倍。本轮由CapitalG和Menlo Ventures领投,英伟达、Salesforce Ventures及德国电信跟投。公司核心技术为文本提示生成AI。
强大的AI视频生成平台,用文本、图像和提示创建惊艳视频
强大的AI批量图像生成器,支持单提示或CSV上传,快速生成大量图像。
全球首个单提示生成60秒完整动漫短片的AI工具,适配社交平台。
Nano Banana AI是先进图像生成与编辑器,用文本提示瞬间创惊艳视觉。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$6
$24
256
Baidu
128
Bytedance
$1.2
$3.6
4
$2
gguf-org
flux2-dev-gguf 是一个基于 FLUX.2-dev 的图像到图像转换模型,专门用于根据文本提示生成特定风格的图像。该模型支持在 ComfyUI 环境中运行,能够将文本描述转换为风格化的视觉内容。
onnx-community
SAM3是基于概念的任意分割模型,能够根据输入的点、框等提示信息生成精确的图像分割掩码。该版本是ONNX格式的SAM3跟踪器模型,通过Transformers.js库可在浏览器环境中高效运行。
sd2-community
Stable Diffusion v2-1-base是基于文本生成图像的扩散模型,在v2-base基础上进行了220k额外步骤的微调优化。该模型能够根据文本提示生成和修改图像,支持多种分辨率输出,适用于艺术创作、教育研究等多个领域。
Stable Diffusion v2 是一个基于扩散模型的文本到图像生成模型,能够根据文本提示生成和修改图像。该模型在LAION-5B数据集子集上训练,结合了自编码器和扩散模型,在潜在空间中进行训练,支持多种分辨率和任务。
noctrex
这是PromptCoT-2.0-SelfPlay-30B-A3B模型的MXFP4_MOE量化版本,专门用于文本生成任务。该模型采用了思维链提示和自博弈训练技术,通过量化优化实现了更高效的推理性能。
stablellama
这是一个基于Qwen/Qwen-Image模型的LyCORIS适配器,专门用于文本到图像和图像到图像的生成任务。该模型在训练过程中未使用验证提示,采用了优化的训练配置和量化技术。
neuralvfx
LibreFLUX-ControlNet是一个基于ControlNet架构的文本到图像生成模型,使用LibreFLUX作为基础Transformer模型。该模型在SA1B数据集上进行训练,能够根据文本提示和控制图像生成高质量的图像内容。
EpistemeAI
这是第一代强大的vibe-code大语言模型,经过优化可直接根据结构松散的'氛围编码'提示生成自然语言和代码补全。相比早期模型,它具有更低的提示工程开销、更平滑的潜在空间插值,更容易引导生成可用代码。
Lambent
Mira是一个基于多个Gemma 3 27B基础模型融合的文本生成模型,通过精心挑选的训练数据和特定训练方式,具备独特的诗意文本生成能力。该模型在角色扮演和创意写作方面表现出色,能够根据不同的系统提示生成富有文学色彩的文本。
nunchaku-tech
基于sdxl-turbo经过Nunchaku量化处理的文本到图像生成模型,旨在根据文本提示生成高质量图像。该模型针对高效推理进行了优化,在保持性能的同时显著减小模型大小。
gtmepm
simpletuner-lora 是一个基于 stabilityai/stable-diffusion-3.5-medium 的 LyCORIS 适配器,专门用于文生图等图像生成任务。该模型通过 LoRA 微调技术实现,主要使用验证提示为'A photo-realistic image of a cat'进行训练。
Alissonerdx
HuMo是一个统一的、以人为中心的视频生成框架,能够根据文本、图像和音频等多模态输入,生成高质量、细粒度且可控的人类视频。它支持强大的文本提示跟随、一致的主体保留以及同步的音频驱动运动。
VeryAladeen
HuMo是一个以人为中心的视频生成框架,能够利用文本、图像和音频等多模态输入生成高质量、细粒度且可控的人类视频,支持文本提示跟随、主体保留和音频驱动运动同步。
Wan-AI
Wan2.2-S2V-14B是一个专为音频驱动的电影级视频生成而设计的混合专家(MoE)模型。它能够根据输入的音频、参考图像和文本提示生成高质量的视频内容,支持480P和720P分辨率,并具备复杂运动生成和电影级美学效果。
camenduru
FLUX.1 [dev] 是一个具有120亿参数的整流流变压器,专门用于文本到图像生成。它在图像生成质量方面表现卓越,仅次于FLUX.1 [pro],具有出色的提示跟随能力和高效的训练方式,为科研和创作提供强大支持。
John6666
Intorealism XL 是一款强大的文本到图像生成模型,能够生成逼真、细腻的图像,涵盖人像、风景等多种主题,在光影、纹理等方面表现出色,严格遵循输入提示进行图像创作。
InvokeAI
FLUX.1 Krea [dev] 是一个拥有120亿参数的先进整流流变换器模型,专门用于根据文本描述生成高质量图像。该模型在美学摄影领域表现卓越,具有出色的提示遵循能力,采用引导蒸馏技术训练,并开放权重供非商业用途使用。
Colossus Project Flux 的 Nunchaku 量化版本,旨在根据文本提示生成高质量图像。该模型在优化推理效率的同时,将性能损失降至最低。
Acly
MobileSAM是一款轻量级的图像分割模型,能够根据点或框提示生成目标掩码,专为在消费级硬件上进行高效推理而设计。
这是一个经过Nunchaku量化的SANA-1.6B模型版本,专门用于根据文本提示生成高质量图像。该模型通过先进的SVDQuant量化技术,在保持生成质量的同时显著优化了推理效率,适用于各种文本到图像的生成任务。
一个基于Model Context Protocol (MCP)的服务,支持规范驱动的开发流程,通过结构化提示引导开发者从需求生成、设计文档到代码实现的系统化开发过程。
AI Studio MCP Server是一个集成Google AI Studio/Gemini API的模型上下文协议服务器,提供支持文件、对话历史和系统提示的内容生成功能。
一个基于FastMCP框架的服务器,通过远程Comfy服务器根据提示生成图像。
该项目是一个基于FastMCP库构建的Kaggle MCP服务器,提供搜索和下载Kaggle数据集的功能,并能生成EDA笔记本提示。
该项目是一个基于Google Veo2模型的视频生成MCP服务器,支持通过文本提示或图像生成视频,并提供MCP资源访问功能。
一个基于MCP协议的图像生成服务器,使用Replicate的flux-schnell模型,支持通过文本提示生成图像,并可配置多种参数。
一个基于TypeScript的MCP服务器,使用OPENAI的dall-e-3模型根据文本提示生成图像,并支持将生成的图像保存到本地指定目录。
oatpp-mcp是基于Oat++框架实现的Anthropic模型上下文协议(MCP),支持自动生成API工具、STDIO和HTTP SSE传输方式,以及提示、资源和工具等服务器功能。
一个基于Git仓库内容生成提示的MCP服务器
cal2prompt是一个命令行工具,可将Google日历日程转换为自定义提示或文本片段,支持模板引擎和MCP服务器模式。
一个基于OpenAI GPT-4o/gpt-image-1模型的图像生成与编辑工具,支持通过文本提示生成图像、编辑图像(如修复、扩展、合成等),并兼容多种MCP客户端。
Image Generation MCP Server是一个为Claude Desktop提供图像生成功能的MCP服务器,使用Replicate Flux模型,支持通过文本提示生成图像,并可通过Smithery或npm安装配置。
Roblox Studio MCP服务器是一个专为Roblox Studio开发设计的TypeScript实现,提供资源、工具和提示,支持LLM应用程序通过标准化接口访问Roblox Studio文档、模板和代码生成功能。
MCP图像生成器是一个基于Together AI或Replicate的图像生成服务,支持通过SSE端点或本地运行,提供根据文本提示生成图像的功能。
OracleDB MCP Server是一个提供Oracle数据库表/列上下文给LLM的服务器,支持通过LLM提示与数据库交互、生成SQL语句并返回结果。
Lucidity是一个模型上下文协议(MCP)服务器,旨在通过智能提示分析提升AI生成代码的质量。它提供结构化指导,帮助识别和解决代码质量问题,支持多种编程语言,并能与AI助手无缝集成。
ComfyUI的MCP服务,提供图像生成和提示词优化功能,支持自动调整尺寸和随机种子生成。
一个基于Google Gemini图像生成模型的MCP服务器,允许AI代理通过文本提示生成、编辑和描述图像,支持多种模型和配置选项。
一个基于Rust库的MCP服务器,用于从代码库生成上下文提示,帮助AI助手更好地理解和处理代码仓库。