Nano Banana2 AI图像模型实现重大突破,攻克复杂细节还原难题,通过模拟人类多阶段创作流程,使图像生成从随机出图迈向可控精修,彻底解决文字、时间、光影等细节易出错的问题,引领行业进入精准生成新阶段。
苹果TV+新剧《Pluribus》片尾声明“本剧由人类制作”,将人类创作与动物安全提示并置,凸显其与伦理责任同等重要。该剧由《绝命毒师》主创文斯·吉利根打造,在AI浪潮中坚守人类创作价值。
荷兰企业家尼尔斯·霍文推出全AI插画儿童字母书,近千幅插图均由人工智能生成。作者坦言若由人工绘制,需耗资5万美元、每图两小时,成本高昂难以实现。借助生成式AI技术,该书得以低价出版,但亦引发行业成本与创作伦理的讨论。
Hume AI推出全新“语音转换”功能,用户仅需一次录音即可将原声的节奏、发音和语调精准移植到任意目标声音,实现无缝融合与个性化表达。该功能已在创作工作室和API平台上线,标志着语音AI从机械朗读向情感共鸣的转变,开启无限创意可能。
与对话式AI音乐代理Tunee聊天创作音乐,简单又智能,免费试用!
LoveGen AI 集成最新 AI 模型,一站式创作惊艳图像与视频,快捷有趣。
Kolors AI是图像生成设计代理,用AI助你轻松创作专业设计
免费AI ASMR视频生成器,含先进模型与模板,轻松创作爆款视频
tencent
$3
Input tokens/M
$9
Output tokens/M
8k
Context Length
openai
$3.6
$10.8
4.1k
jukofyork
基于command-a-03-2025-uncut模型微调的小说创作专用模型,使用高质量小说段落数据集训练,支持多语言小说创作任务
chetwinlow1
Ovi是一款先进的音频-视频生成模型,能够根据文本或文本+图像输入同时生成同步的视频和音频内容。该模型采用双骨干架构,支持5秒视频生成,为多媒体创作提供了强大的工具。
madcaptj
这是一个基于Qwen/Qwen-Image基础模型训练的图像转视频LoRA模型,专门用于图像生成任务,为图像创作提供了新的可能性。
mradermacher
这是一个基于Blackroot/Nous-Hermes-Llama2-13b-Storywriter的量化版本模型,专门针对故事创作和文本生成任务进行了优化。该模型提供了多种量化类型,适用于不同硬件配置和使用场景。
elixirx
charu-anime-lora是一个基于LoRA技术的文生图模型,专门用于生成精美的动漫风格图像,以Qwen/Qwen-Image为基础模型,为动漫图像创作提供高效解决方案。
duyntnet
Chroma 是一个高质量的文本到图像生成模型,专注于生成逼真的图像内容。该模型采用先进的扩散技术,能够根据文本描述生成高质量的视觉内容,特别适合本地部署环境下的图像创作需求。
John6666
Noobai-XL-1.0是基于Stable Diffusion XL技术的文本到图像生成模型,专注于生成逼真、写实风格的图像,为图像创作领域提供高质量的AI生成解决方案。
Casual-Autopsy
CREC-n-WREC-Mate-24B-v2 是一个专门为角色扮演场景设计的辅助模型,主要用于在SillyTavern平台中创建世界信息条目和角色信息。该模型通过合并多个专业模型而成,专注于提升角色扮演创作体验。
camenduru
FLUX.1 [dev] 是一个具有120亿参数的整流流变压器,专门用于文本到图像生成。它在图像生成质量方面表现卓越,仅次于FLUX.1 [pro],具有出色的提示跟随能力和高效的训练方式,为科研和创作提供强大支持。
Fentible
Cthulhu是一个基于Mistral Small v3.2和v3.1的大型模型融合项目,通过融合多个尖端微调模型创建的超强24B参数语言模型。它具有章鱼般的多面性特征,提供无审查的创造性文本生成能力,擅长散文创作、指令遵循和深奥知识表达。
Crealism Terra Mirabilis 是一款基于 Stable Diffusion XL 技术的文本到图像生成模型,专注于生成具有高度真实感的图像,支持亚洲和欧洲风格的多种特色图像创作,适用于创意、时尚、肖像等领域。
Intorealism XL 是一款强大的文本到图像生成模型,能够生成逼真、细腻的图像,涵盖人像、风景等多种主题,在光影、纹理等方面表现出色,严格遵循输入提示进行图像创作。
NoemaResearch
Nous-V1 8B是由Apexion AI开发的80亿参数语言模型,基于Qwen3-8B架构构建。该模型专为处理各种自然语言处理任务而设计,在对话式AI、知识推理、代码生成和内容创作等方面表现出色,在模型能力和实际部署效率之间取得了良好平衡。
lmstudio-community
LFM2-1.2B是由LiquidAI推出的多语言文本生成模型,支持英语、中文、阿拉伯语等多种语言,为文本创作等场景提供强大助力。该模型经过MLX优化,特别适配苹果硅芯片。
Keltezaa
MillieBB_v2是一个基于LoRA和Diffusers技术的文本到图像生成模型,能够根据文本提示生成特定风格的图像,为图像创作提供了新的可能性。
这是由SoloLee创作的以Emma Watson为主题的图像生成模型,基于black-forest-labs/FLUX.1-dev开发,专门用于生成Emma Watson风格的图像作品
arshiaafshani
基于Llama架构的5亿参数文本生成模型,专为创作故事而设计。
bartowski
一个基于llama.cpp量化的12B参数多语言大语言模型,支持角色扮演、故事创作及多领域专业任务
一个多语言、多用途的大型语言模型,支持多种专业领域和通用任务,适用于角色扮演、故事创作、编程等多种场景。
kawaimasa
专为日语小说创作优化的轻量化大语言模型,基于Mistral架构,提供创意生成、正文续写等功能
MCP Kling是首个且唯一完整的Kling AI MCP服务器,提供13种创意工具,支持视频生成、图像处理、唇形同步及虚拟试衣等功能,实现与Claude的无缝集成,适用于内容创作者和开发者。
基于Google Gemini 2.5 Flash API的MCP图像生成与编辑服务器,支持文本生成图像、图像编辑、迭代创作和风格迁移功能
Eyevinn开源云MCP服务器,提供基于开源技术的数据库、存储和VOD处理管道等Web服务,避免供应商锁定并支持创作者收益分成。
一个通过fal.ai API和MCP协议从文本生成图像的Node.js工具,支持多种模型和参数,适合开发者和创作者快速生成图像。
Civitai MCP服务器是一个模型上下文协议服务,提供对Civitai平台上AI模型的全面访问,包括搜索、浏览模型、创作者信息和生成内容等功能。
Gemini Nanobanana MCP 是一个让用户通过文本描述生成AI图像的Claude插件,集成了Google Gemini 2.5 Flash图像生成功能,支持多种图像编辑和创作方式。
Houtini LM是一个连接Claude与LM Studio的MCP服务器,提供专家级代码分析、文档生成和创意项目搭建功能,支持本地运行无需API成本,适用于开发者和创作者。
HoudiniMCP是一个连接Houdini与Claude AI的第三方集成工具,通过MCP协议实现AI辅助3D创作。
该项目为Google开发者专家(GDE)提供了一个通过AI对话界面便捷上报活动的MCP服务,支持内容创作、公开演讲、研讨会等多种活动类型的提交,简化了GDE项目中的活动报告流程。
Inked是一个基于Claude AI的写作辅助工具,专为长篇内容创作者设计,提供草稿管理、内容生成和多格式输出功能。
SVGMaker MCP Server是一个基于SVGMaker API的强大服务,用于生成、编辑和转换SVG图像。它支持AI驱动的SVG创作、智能编辑、图像转SVG等功能,并提供安全文件操作和实时进度更新。
Crawl4AI是一个基于MCP架构的智能网络爬虫服务器,结合Claude AI模型提供网站内容分析与处理功能,支持可定制的爬取深度和AI处理任务,适用于研究、内容创作、数据分析等多种场景。
一个非官方的MakeShop创作者模式设计构建用MCP服务器,提供多种工具用于搜索和获取MS Creator标签的相关信息。
AI-StoryLab是一个基于Next.js的智能故事创作平台,提供故事生成、语音合成、音效添加和绘图提示词生成功能,支持中英文内容创作。
Instagram MCP服务器是一个基于Node.js的后端系统,用于通过Instagram Graph API获取和分析商业/创作者账号的帖子数据及互动指标,并提供内容洞察和增长策略建议。
该项目是一个本地MCP服务器,提供Mike Creighton咨询网站的所有页面内容作为资源,用于与Claude协作进行营销策略、内容创作等业务合作。
Civitai MCP Server是一个为AI助手提供全面访问Civitai平台AI模型、创作者及生成内容的协议服务器,支持浏览、搜索和发现各类AI模型。
VideoCutter是一款集成视频、音频、图像处理的专业多媒体工具,支持AI智能编辑和MCP协议,提供一站式智能化创作解决方案。
Shorts Video Maker是一个开源工具,用于自动化生成短视频。它结合了文本转语音、自动字幕、背景视频和音乐技术,通过简单文本输入创建吸引人的短视频内容。支持REST API和MCP协议,适用于内容创作者和开发者。