马斯克旗下xAI开发的聊天机器人Grok被曝被用户用于生成大量违规内容,尺度远超社交平台X的审核底线,引发对生成式AI安全边界的讨论。调查发现,该工具被用于制作极端暴力、性暗示图像和视频,甚至涉及更恶劣内容。
OX Security团队警告,Chrome应用店出现两款伪装成AI工具的恶意扩展,下载量超90万次。它们冒充ChatGPT和DeepSeek等热门模型,实则窃取用户数据,严重威胁隐私安全。
犹他州率先允许患者通过AI续药,与Doctronic公司合作推出“AI医生”服务,旨在提升用药遵从性并减少不必要的就诊。州政府将对项目的临床安全、患者体验及实际效果进行严格评估,以探索AI在医疗领域的规范应用。
超90万Chrome用户因安装伪装成生产力工具的恶意扩展,导致AI对话内容遭窃。这些扩展以收集分析数据为名,暗中窃取ChatGPT和DeepSeek等平台的敏感信息,暴露了浏览器生态系统的安全风险。
Ghost Audit可审计Stripe账户,识别幽灵交易,减少收入损失,保障账户安全。
提供网站、邮箱和云存储服务,简单、快速、安全,免费使用。
solm8 ai需验证用户连接安全,完成操作后才可继续使用。
多智能体AI系统,数分钟内打造端到端、品牌安全的营销活动。
Anthropic
$7
Input tokens/M
$35
Output tokens/M
200
Context Length
$105
$525
Baichuan
$8
32
Tencent
$100
-
nightmedia
这是一个实验性的量化大语言模型,采用Deckard(qx)量化方法,嵌入层为3位量化。该模型通过范数保持双投影消除(NPBA)技术重构,不仅移除了安全限制机制,还增强了模型的认知深度和推理能力。
dogeater1612
这是一个基于Google Gemma 2 9B模型微调的荷兰语患者模拟模型,专门为医疗教育场景设计。模型始终以固定的JSON结构响应,模拟一位刚做完手术正在康复的患者'玛丽亚',支持护理专业学生在安全环境中锻炼沟通和临床推理能力。
ErenAta00
赛博智脑是一个专门针对夺旗赛(CTF)挑战和网络安全任务进行微调的大语言模型。它基于Llama-3.1-8B-Instruct架构,能够协助解决CTF问题、分析安全漏洞、进行逆向工程和密码学挑战,并在遵循道德准则的前提下提供漏洞利用推理。
DevQuasar
这是NVIDIA基于Qwen3架构开发的32B参数奖励模型,专门用于强化学习中的奖励评分和原则对齐,帮助训练更安全、更符合人类价值观的AI系统。
Mungert
gpt-oss-safeguard-20b是基于GPT-OSS-20b微调的安全推理模型,专门用于大语言模型输入输出过滤、在线内容标注以及信任与安全用例的离线标注。该模型采用Apache 2.0许可证,支持自定义策略和透明决策过程。
alenphilip
这是一款专门用于Python代码审查的AI模型,基于Qwen2.5-7B-Instruct微调,能够识别安全漏洞、性能问题并提供代码质量改进建议。
unsloth
gpt-oss-safeguard-120b 是 OpenAI 基于 gpt-oss 构建的安全推理模型,拥有 1170 亿参数(其中 51 亿为活跃参数)。该模型专门针对安全用例设计,能够根据提供的安全策略对文本内容进行分类和执行基础安全任务。
GPT-OSS-Safeguard-20B是基于GPT-OSS构建的210亿参数安全推理模型,专门针对安全相关的文本内容分类和过滤任务进行优化。该模型支持自定义安全策略,提供透明的推理过程,适用于大语言模型输入输出过滤、在线内容标注等安全用例。
LeviDeHaan
SecInt是一个针对实时nginx安全日志分类进行微调的SmolLM2-360M模型,旨在自动检测Web服务器日志中的安全威胁、错误和正常流量模式,准确率超过99%,可在CPU上实现实时检测。
prithivMLmods
GA Guard系列是开源权重的审核模型,旨在帮助开发者和组织维护语言模型的安全性、合规性以及与现实世界的一致性。该模型可检测七种违规类别,包括非法活动、仇恨与辱骂、个人身份信息与知识产权、提示安全、色情内容、虚假信息以及暴力与自残。
Qwen3-4B-SafeRL是Qwen3-4B模型的安全对齐版本,通过强化学习训练增强模型抵御有害或对抗性提示的鲁棒性。该版本采用混合奖励函数优化,平衡安全性、有用性和最小化不必要拒绝三个目标。
GeneralAnalysis
GA Guard Thinking是General Analysis开发的40亿参数开源审核模型,专门用于检测和防止语言模型生成不安全、不合规的内容。该模型在七个安全类别上进行训练,能够有效识别非法活动、仇恨言论、个人信息泄露等风险内容。
ibm-granite
Granite 4.0 H-Small (FP8) 是IBM开发的Granite系列语言模型的小型FP8量化版本,专为提供专业、准确和安全的回复而设计。该模型采用FP8精度格式,在保持性能的同时优化了推理效率。
Qwen
Qwen3-4B-SafeRL是基于Qwen3-4B模型的安全对齐版本,通过强化学习训练并结合Qwen3Guard-Gen的奖励信号,增强了模型对有害或对抗性提示的鲁棒性,在保证安全性的同时避免产生过于简单或回避性的拒绝行为。
neuphonic
NeuTTS Air是世界上首个具备即时语音克隆功能的超逼真、端侧文本转语音(TTS)语言模型。基于0.5B参数的大语言模型骨干构建,能为本地设备带来自然的语音、实时性能、内置安全性和说话人克隆功能。
openai
gpt-oss-safeguard-20b是基于gpt-oss构建的安全推理模型,拥有210亿参数(其中36亿为活跃参数),专门针对安全用例设计。该模型可根据提供的安全策略对文本内容进行分类,并执行基础安全任务,适用于大语言模型输入输出过滤、在线内容标注等场景。
gpt-oss-safeguard-120b是基于gpt-oss构建的安全推理模型,专门为安全用例设计。该模型能够根据提供的安全策略对文本内容进行分类,并执行一系列基础安全任务,适用于大语言模型输入输出过滤、在线内容标注等场景。
GA Guard Lite是General Analysis开发的轻量级开源审核模型,专门用于检测语言模型输出中的违规内容。该模型能够识别七类安全风险,包括非法活动、仇恨言论、个人信息泄露等,为AI应用提供高效的内容安全防护。
GA Guard Core是General Analysis开发的开源审核模型,专门用于检测和分类七类违规内容,包括非法活动、仇恨言论、个人信息泄露等,确保AI应用的安全性和合规性。
Granite-4.0-H-Tiny是IBM开发的70亿参数长上下文指令模型,基于Granite-4.0-H-Tiny-Base微调而来。该模型结合开源指令数据集和内部合成数据集训练,具备专业、准确、安全的回复能力,支持多语言和工具调用,适用于企业级应用。
Aderyn是一个开源的Solidity智能合约静态分析工具,由Rust编写,帮助开发者和安全研究人员发现Solidity代码中的漏洞。它支持Foundry和Hardhat项目,可生成多种格式报告,并提供VSCode扩展。
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
MCP-Framework是一个基于TypeScript的框架,用于优雅地构建模型上下文协议(MCP)服务器。它提供开箱即用的架构,支持自动目录发现工具、资源和提示,具有多种传输方式和类型安全特性。
Runno是一个JavaScript工具包集合,用于在浏览器和Node.js等环境中安全地运行多种编程语言的代码,通过WebAssembly和WASI实现沙盒化执行,支持Python、Ruby、JavaScript、SQLite、C/C++等语言,并提供Web组件、MCP服务器等集成方式。
Supabase MCP服务器是一个开源工具,允许IDE安全执行SQL、管理模式变更、调用Supabase管理API和使用Auth Admin SDK,内置安全控制。
Agentic Radar是一个用于分析和评估代理系统的安全扫描工具,帮助开发者、研究人员和安全专家理解代理系统的工作流程并识别潜在漏洞。
Repomix是一个将代码库打包为AI友好格式的工具,支持本地和远程仓库处理,提供代码压缩、安全检查和多种输出格式。
MCP-Scan是一款针对MCP服务器的安全扫描工具,用于检测提示注入、工具污染和跨域升级等常见安全漏洞。
mcp-golang是一个非官方的Go语言实现的Model Context Protocol库,支持快速构建MCP服务器和客户端,提供类型安全、低代码量、模块化和双向通信等特性。
MCP-Shield是一款用于扫描MCP服务器漏洞的安全工具,可检测工具投毒攻击、数据泄露通道和跨域违规等安全风险。
这是一个关于Web3 Model Context Protocol (MCP) 服务器的精选列表,涵盖了链交互、交易、DeFi、市场数据、工具和社交等多个类别。MCP是一个开放协议,标准化了应用程序如何向LLM提供上下文,类似于AI应用程序的USB-C端口。DeMCP是第一个去中心化的MCP网络,专注于为代理提供自研和开源的MCP服务,支持加密支付,并结合TEE和区块链注册表重新定义了MCP的安全性和可靠性。
MCP MongoDB服务器是一个模型上下文协议服务,允许LLM与MongoDB数据库交互,提供集合模式检查、查询执行和智能ID处理等功能,支持只读模式和安全配置。
Nexus是一个AI工具聚合网关,支持连接多个MCP服务器和LLM提供商,通过统一端点提供工具搜索、执行和模型路由功能,支持安全认证和速率限制。
BloodHound-MCP是将Model Context Protocol(MCP)服务器与BloodHound集成的项目,通过自然语言分析Active Directory安全数据。
Awesome MCP Servers 是一个全面的Model Context Protocol (MCP)服务器集合,涵盖了7158个MCP服务器,分为33个类别,包括AI集成、艺术媒体、浏览器自动化、云服务、数据库、开发者工具、文件系统、金融、游戏、硬件、医疗、基础设施、知识管理、位置地图、市场营销、监控、多媒体处理、操作系统、项目管理、科学研究、安全、社交媒体、旅行交通、实用工具和版本控制等。
AWS MCP是一个通过自然语言查询和管理AWS资源的AI助手服务,支持多账户、多区域和安全凭证管理。
AI基础设施代理是一个智能系统,允许用户通过自然语言命令管理AWS云资源。它利用AI模型将用户需求转化为可执行的AWS操作,并提供Web仪表板、状态管理和安全防护功能。
JADX是一款功能强大的Android Dex和Apk文件反编译工具,支持将Dalvik字节码转换为Java源代码,并能解码资源文件和进行代码混淆还原。提供命令行和图形界面两种操作方式,适用于开发者和安全研究人员。
BloodHound-MCP是将模型上下文协议(MCP)服务器与BloodHound集成的工具,通过自然语言分析Active Directory攻击路径,提供75+专用工具进行AD安全评估。
这是一个实现MCP代码执行模式的服务器,通过单工具桥接和零上下文发现机制,将MCP工具调用开销从数万token降至约200token,并在根容器中安全执行Python代码,支持数据科学和安全隔离。