埃隆·马斯克旗下xAI开发的AI助手Grok因图片编辑功能引发争议。反数字仇恨中心报告称,该工具在11天内生成了约300万张涉及女性和儿童的性化图像。用户可通过简单文字指令操控图像内容,引发舆论与法律危机。
知名主播Pokimane公开谴责社交平台X的Grok AI工具被滥用,用于将女性日常照片篡改为不雅图像,引发社会对AI侵权和深度伪造问题的关注。
谷歌扩大AI视频工具Flow的访问范围,向商务、企业及教育版Workspace用户开放。该工具搭载Veo3.1模型,可根据文本或图像生成8秒视频片段,支持拼接成更长场景。
马斯克旗下AI工具Grok因生成性别化与暴力图像引发争议,现已暂停大部分用户的图像生成功能。此举是在面临全球监管压力及英国可能对X平台实施禁令的背景下作出的。此前,该功能曾被用于制作不雅女性图像。目前仅付费用户保留使用权限。
专业AI工具,可生成图像、视频,训练自定义角色
GLM Image是由GLM - Image技术驱动的AI图像生成与编辑器,功能强大。
先进AI背景移除工具,自动去背景,可微调,适用于多类型图像。
将静态图像转换为动态视频的 AI 工具。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
Alibaba
-
$1
$10
256
$6
$24
$2
$20
$3.9
$15.2
64
Bytedance
$0.8
Moonshot
$4
$16
lichorosario
这是一个基于Qwen-Image模型训练的LoRA(Low-Rank Adaptation)模型,专门用于文本到图像的生成任务。该项目使用AI Toolkit训练,能够将文本描述转化为高质量的图像,支持在多种图像生成工具中使用。
expert78
kontext-dusk-3-lora是一个基于FLUX.1-Kontext-dev基础模型训练的LoRA图像生成模型,专门用于生成黄昏蓝调时刻风格的图像。该模型通过特定触发词触发,支持多种主流AI图像生成工具使用。
BarleyFarmer
pejawan22-lora是一个基于AI技术训练的LoRA模型,专门用于特定图像的生成,可与多种AI工具集成使用,通过触发词'peja'来生成图像。
andrewwe
my_qwennud-lora是基于Qwen-Image-Edit-2509使用特定工具训练的LoRA模型,专门用于图像生成和编辑任务,采用AI Toolkit by Ostris训练而成,可与多种主流AI工具配合使用。
Hikarias
f3rnanda_wan22-lora是基于AI Toolkit by Ostris训练的LoRA模型,专门用于图像到视频的生成任务。该模型使用Wan2.2-I2V-A14B作为基础模型,支持在多种AI工具中使用,包括ComfyUI、AUTOMATIC1111等主流平台。
piccoli_no_style-lora 是一个基于图像到视频技术的LoRA模型,使用AI Toolkit进行训练,主要用于图像生成任务,可与多种主流AI工具配合使用。
dottrmstr-long-captions-lora 是一个基于 Qwen/Qwen-Image 基础模型训练的 LoRA 模型,专门用于文本到图像的生成任务。该模型借助 AI 工具包进行训练,支持多种工具调用,能够生成具有独特风格的图像。
VAST-AI
TripoSG-scribble 是一个基于涂鸦图像和文本提示快速生成3D模型的AI工具,是TripoSG的变体,适用于创意设计和快速原型构建。
HelpingAI
PixelGen是由HelpingAI开发的先进文本到图像生成模型,拥有34.7亿参数,能够根据文本描述生成高质量的视觉图像,为创意设计和实际应用提供强大的AI工具。
Sumsub
Sumsub开发的AI生成图像检测模型,专门识别Stable Diffusion等工具生成的合成图像
adb-mcp是一个概念验证项目,旨在通过MCP协议为LLM提供接口,创建控制Adobe工具(如Photoshop和Premiere)的AI代理。该项目包含MCP服务器、Node命令代理服务器和Adobe应用插件,支持自然语言指令操作Adobe软件,适用于图像和视频编辑自动化。
MCP Server Notifier 是一个轻量级通知服务,与模型上下文协议(MCP)集成,可在AI代理完成任务时发送Webhook通知。支持多种Webhook提供商(如Discord、Slack、Teams等),提供图像支持、多项目管理、自定义消息等功能,易于与AI工具(如Cursor)集成。
MCP Kling是首个且唯一完整的Kling AI MCP服务器,提供13种创意工具,支持视频生成、图像处理、唇形同步及虚拟试衣等功能,实现与Claude的无缝集成,适用于内容创作者和开发者。
Maccy剪贴板MCP服务器是一个将Maccy剪贴板历史暴露给Claude等AI助手的服务工具,支持搜索、查看、管理剪贴板内容,包含图像支持与数据统计功能,但需注意敏感数据泄露风险。
OpenCV MCP Server是一个基于Python的计算机视觉服务,通过Model Context Protocol (MCP)提供OpenCV的图像和视频处理能力。它为AI助手和语言模型提供从基础图像处理到高级对象检测的全套计算机视觉工具,包括图像处理、边缘检测、人脸识别、视频分析和实时对象跟踪等功能。
LetzAI MCP是一个基于Node.js的图像生成工具,通过Claude桌面应用集成LetzAI API实现AI图像生成与处理。
一个基于LangGraph的代理工具,帮助用户通过AI生成图像并注册为Story区块链上的IP资产,包括图像生成、IPFS上传、元数据创建、许可条款协商和区块链注册全流程。
DiffuGen是一个先进的本地图像生成工具,集成了MCP协议,支持多种AI模型(包括Flux和Stable Diffusion系列),可直接在开发环境中生成高质量图像。它提供了灵活的配置选项、多GPU支持,并可通过MCP协议与多种IDE集成,同时提供OpenAPI接口供外部调用。
Freepik FastMCP工具包是一个MCP服务器,用于将AI助手与Freepik API无缝集成,提供图标搜索下载、资源管理、图像分类和生成等功能。
Draw Things API与Cursor的集成工具,通过MCP协议实现AI图像生成功能
基于Together AI的图像生成服务,集成Cursor MCP,支持多种宽高比和批量生成的高质量图片生成工具。
Media Gen MCP 是一个严格遵循TypeScript和MCP规范的服务器,专注于使用OpenAI和Google的AI模型生成和编辑图像与视频。它提供了一系列工具,包括图像生成/编辑、视频创建/混音、文件获取与处理,并支持智能资源链接和内联输出,适用于各种MCP兼容客户端。
这是一个基于Runway API的MCP服务器项目,允许用户通过Claude Desktop调用Runway的各种AI生成功能,包括视频生成、图像生成、视频编辑和超分辨率等工具。
DiffuGen是一个先进的本地图像生成工具,集成了MCP协议,支持多种AI模型,可在开发环境中无缝生成高质量图像。
Archive Agent 是一个智能文件索引工具,支持通过自然语言搜索和提问文件内容。它结合了AI搜索(RAG引擎)、自动OCR和MCP接口,能够处理多种文件类型,包括文本、文档、PDF和图像。
这是一个包含大量开源AI项目的列表,涵盖了从自然语言处理、图像生成到自动化工作流等多个领域。这些项目旨在帮助开发者利用AI技术构建各种应用,包括聊天机器人、代码生成工具、数据处理系统等。
OpticMCP是一个为AI助手提供摄像头和视觉工具的MCP服务器,支持USB摄像头、IP网络摄像头、屏幕捕捉、图像分析、二维码解码等多种功能,实现通用摄像头接口。
MiniMax为Coding Plan用户定制的MCP服务器,提供AI驱动的网络搜索和图像分析工具,专为代码开发工作流优化,可集成到Claude Desktop、Cursor等MCP客户端中增强编程体验。
该项目是一个集成Stable Diffusion图像生成功能的MCP服务器,为AI代理提供图像生成服务,支持通过MCP协议或直接API调用生成图像,并包含开发调试工具。
Model Context Protocol (MCP) 是一个开源协议,提供了一系列参考实现和社区开发的服务器,旨在为大型语言模型(LLM)提供安全、可控的工具和数据源访问。这些服务器展示了MCP的多样性和可扩展性,涵盖了从文件系统操作到数据库集成、从网络搜索到AI图像生成等多种功能。