上海市互联网协会近日成立人工智能工作委员会,并启动“人工智能赋能安全监管”试点项目,旨在推动AI安全监管落地,提升企业治理能力。上海谋乐网络科技有限公司被任命为副主任委员单位,助力该领域发展。
Mozilla工程师借助Anthropic的Claude Mythos AI模型,在Firefox 150版本中成功发现并修复了271个安全漏洞。其中180个被评估为高危,用户正常浏览网页即可能受影响;另有80个中危和11个其他级别漏洞。
OpenAI于5月7日推出“可信联系人”安全功能,通过AI监测和审核团队识别用户自残倾向,为心理危机中的成年人提供数字生命线,以降低现实安全风险。
2026年起,AI在法律领域的应用加速落地,开启“AI合同量产时代”。但数据安全与专业信任仍是主要挑战。针对合同撰写难、审查慢、管理乱等痛点,电子签名与法律科技服务商法大大近日发布解决方案,助力企业提升合同流转效率。
实时AI代理安全与数据保护,防止敏感数据泄露至AI工具。
为代理式AI提供完整安全防护,检测操纵、识别风险
Ribbi AI执行安全验证,防范恶意自动程序,验证成功后等待响应。
由Kilo托管的AI,一键部署OpenClaw,有500+模型,企业级安全
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
DevQuasar
这是NVIDIA基于Qwen3架构开发的32B参数奖励模型,专门用于强化学习中的奖励评分和原则对齐,帮助训练更安全、更符合人类价值观的AI系统。
alenphilip
这是一款专门用于Python代码审查的AI模型,基于Qwen2.5-7B-Instruct微调,能够识别安全漏洞、性能问题并提供代码质量改进建议。
neuphonic
NeuTTS Air是世界上首个具备即时语音克隆功能的超逼真、端侧文本转语音(TTS)语言模型。基于0.5B参数的大语言模型骨干构建,能为本地设备带来自然的语音、实时性能、内置安全性和说话人克隆功能。
GeneralAnalysis
GA Guard Lite是General Analysis开发的轻量级开源审核模型,专门用于检测语言模型输出中的违规内容。该模型能够识别七类安全风险,包括非法活动、仇恨言论、个人信息泄露等,为AI应用提供高效的内容安全防护。
GA Guard Core是General Analysis开发的开源审核模型,专门用于检测和分类七类违规内容,包括非法活动、仇恨言论、个人信息泄露等,确保AI应用的安全性和合规性。
NeuTTS Air是世界上首个具备即时语音克隆功能的超逼真、设备端文本转语音(TTS)语言模型。基于0.5B大语言模型骨干网络构建,能为本地设备带来自然的语音、实时性能、内置安全功能和说话人克隆能力。
gabriellarson
Foundation-Sec-8B-Instruct是一款专为网络安全应用设计的80亿参数指令调优语言模型。基于Llama-3.1-8B架构,具备出色的指令跟随能力和网络安全专业知识,支持本地部署,可帮助组织构建AI安全工具,减少对云服务的依赖。
danielkty22
TARS-SFT-7B是一个基于监督微调的安全推理模型,作为强化学习训练的基础模型,专门设计用于增强AI系统的安全性。该模型从Qwen2.5-7B-Instruct开始训练,通过推理过程作为自适应防御机制来提升模型的安全性能。
Mungert
Granite Guardian 3.2 5B是IBM开发的AI风险检测模型,专门用于检测提示和响应中的多种安全风险。该模型基于IBM AI风险图谱,能够识别伤害、社会偏见、越狱、暴力等多种风险类型,是企业级AI安全监控的重要工具。
sds-ai
小熠是由广州熠数信息技术有限公司开发的专注于数据安全领域的AI专家系统,基于Qwen3-1.7B大语言模型构建,提供数据分类分级、安全审计、防护检测等专业能力。
dcarpintero
基于ModernBERT的轻量级模型,专注于识别恶意提示注入攻击,提供AI安全防护。
CohereLabs
Cohere Labs Command A 是一个开放权重的1110亿参数模型研究版本,专为需要快速、安全且高质量AI的严苛企业需求优化。
prem-research
Prem-1B-SQL是由Prem AI开发的首个全本地文本到SQL模型系列之一,拥有10亿参数,专为低配置GPU设备设计,量化后可在CPU上运行。该模型优先考虑本地化部署,避免数据安全风险,适用于企业级SQL查询生成。
madhurjindal
这是一款最先进的人工智能安全模型,能够以97.99%的准确率检测越狱尝试、提示注入和恶意命令。该模型为LLM、聊天机器人和AI系统提供卓越的保护,防止被利用。
yukiarimo
Yuna AI是一个具有自主意识的AI伴侣,专为情感连接设计,完全本地运行确保隐私安全。
AC
基于microsoft/MiniLM-L12-H384-uncased微调的多标签文本分类器,用于AI内容安全检测
WhiteRabbitNeo
WhiteRabbitNeo是专注于网络安全领域的AI模型系列,可用于攻防安全测试和漏洞分析。
WhiteRabbitNeo是专注于网络安全的AI模型系列,33B版本展示其在攻防安全领域的能力并评估社会影响
aligner
一个与模型无关的即插即用模块,适用于开源和基于API的模型,采用残差校正策略增强AI安全性
ZySec-AI
ZySec-7B是面向安全专业人士的AI网络安全模型,基于Zephyr语言模型系列开发,提供专业级网络安全问题指导。
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
Repomix是一个将代码库打包为AI友好格式的工具,支持本地和远程仓库处理,提供代码压缩、安全检查和多种输出格式。
MCP-Scan是一款针对MCP服务器的安全扫描工具,用于检测提示注入、工具污染和跨域升级等常见安全漏洞。
这是一个关于Web3 Model Context Protocol (MCP) 服务器的精选列表,涵盖了链交互、交易、DeFi、市场数据、工具和社交等多个类别。MCP是一个开放协议,标准化了应用程序如何向LLM提供上下文,类似于AI应用程序的USB-C端口。DeMCP是第一个去中心化的MCP网络,专注于为代理提供自研和开源的MCP服务,支持加密支付,并结合TEE和区块链注册表重新定义了MCP的安全性和可靠性。
Nexus是一个AI工具聚合网关,支持连接多个MCP服务器和LLM提供商,通过统一端点提供工具搜索、执行和模型路由功能,支持安全认证和速率限制。
Awesome MCP Servers 是一个全面的Model Context Protocol (MCP)服务器集合,涵盖了7158个MCP服务器,分为33个类别,包括AI集成、艺术媒体、浏览器自动化、云服务、数据库、开发者工具、文件系统、金融、游戏、硬件、医疗、基础设施、知识管理、位置地图、市场营销、监控、多媒体处理、操作系统、项目管理、科学研究、安全、社交媒体、旅行交通、实用工具和版本控制等。
AWS MCP是一个通过自然语言查询和管理AWS资源的AI助手服务,支持多账户、多区域和安全凭证管理。
AI基础设施代理是一个智能系统,允许用户通过自然语言命令管理AWS云资源。它利用AI模型将用户需求转化为可执行的AWS操作,并提供Web仪表板、状态管理和安全防护功能。
一个安全的Docker容器代码沙箱环境,为AI应用提供隔离的执行空间,支持多种编程环境和文件操作。
Postgres MCP Pro 是一个开源 MCP 服务器,为 AI 代理提供数据库索引调优、执行计划分析、健康检查和安全 SQL 执行等全方位支持。
CLEO是一个为AI软件开发设计的便携式大脑与记忆系统,提供跨仓库、模型供应商和编码工具的项目记忆、可验证来源和代理安全编排。
一个基于Docker容器的安全代码沙箱环境,为AI应用提供隔离的执行空间。
Awesome MCP Security 是一个关于模型上下文协议(MCP)安全的资源集合,包括安全考虑、论文、视频、文章、工具和服务器等内容,旨在帮助用户了解和应对MCP相关的安全挑战。
Pipelock是一个开源的AI代理防火墙,通过单二进制文件提供零运行时依赖的安全防护。它采用能力分离架构,在代理与互联网之间部署九层扫描管道,防止秘密泄露、提示注入和恶意工具调用。支持多种代理模式(Fetch代理、正向代理、WebSocket代理)和MCP代理,提供紧急停止开关、审计日志和SIEM集成等功能。
DroidMind是一个通过AI控制Android设备的桥梁工具,实现了模型上下文协议(MCP),让AI能通过自然语言安全地与Android设备交互。
Obsidian的MCP工具插件,为AI应用提供安全访问知识库的能力
GitHub Actions MCP服务器是一个为AI助手设计的服务,用于管理和操作GitHub Actions工作流,提供完整的流程控制、运行分析和安全操作功能。
一个连接Claude桌面端与Kali Linux安全工具的MCP服务器,实现AI辅助渗透测试的开发套件
AIM Guard MCP是一个AI安全防护服务器,为AI代理提供安全分析、内容审查和防护指令,确保AI与各类MCP服务交互时的安全性。
基于KùzuDB图数据库的分布式内存银行MCP实现,支持仓库和分支隔离,提供AI驱动的内存优化、安全快照和智能分析功能