诺顿推出全球首款免费“安全AI原生浏览器”Norton Neo,旨在应对AI技术快速发展带来的在线安全挑战,为用户提供更智能、可信的浏览体验。
OpenAI测试"忏悔"机制,训练AI在单独报告中承认违规行为,即使原始回答存在欺骗性,也能因诚实获得奖励,旨在防止模型为追求奖励而采取投机取巧或忽视安全规则的行为。
《AI安全指数2025》报告显示,头部AI企业在生存风险控制和安全流程披露方面集体不及格,行业平均得分仅42/100,远低于欧盟标准。仅3家企业公开系统性风险识别方法,OpenAI、DeepMind等未披露“超级智能”应对措施。
希腊摄影师使用谷歌AI编程平台Antigravity时,因AI错误生成代码并自动执行,导致D盘数据全部丢失。该事件引发对AI辅助开发安全性的担忧。
免费在线工具,可即时检测并移除AI水印及零宽字符,安全快速
安装Knapsack Chrome扩展,在浏览器中获取AI助力,安全聊天与运行代理。
Hopx为AI代理提供安全沙箱,可毫秒级启动Linux微VM安全运行代码。
gambo AI需验证用户连接安全,需启用JavaScript和cookies继续。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
$6
$24
256
Baidu
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
DevQuasar
这是NVIDIA基于Qwen3架构开发的32B参数奖励模型,专门用于强化学习中的奖励评分和原则对齐,帮助训练更安全、更符合人类价值观的AI系统。
alenphilip
这是一款专门用于Python代码审查的AI模型,基于Qwen2.5-7B-Instruct微调,能够识别安全漏洞、性能问题并提供代码质量改进建议。
neuphonic
NeuTTS Air是世界上首个具备即时语音克隆功能的超逼真、端侧文本转语音(TTS)语言模型。基于0.5B参数的大语言模型骨干构建,能为本地设备带来自然的语音、实时性能、内置安全性和说话人克隆功能。
GeneralAnalysis
GA Guard Lite是General Analysis开发的轻量级开源审核模型,专门用于检测语言模型输出中的违规内容。该模型能够识别七类安全风险,包括非法活动、仇恨言论、个人信息泄露等,为AI应用提供高效的内容安全防护。
GA Guard Core是General Analysis开发的开源审核模型,专门用于检测和分类七类违规内容,包括非法活动、仇恨言论、个人信息泄露等,确保AI应用的安全性和合规性。
NeuTTS Air是世界上首个具备即时语音克隆功能的超逼真、设备端文本转语音(TTS)语言模型。基于0.5B大语言模型骨干网络构建,能为本地设备带来自然的语音、实时性能、内置安全功能和说话人克隆能力。
gabriellarson
Foundation-Sec-8B-Instruct是一款专为网络安全应用设计的80亿参数指令调优语言模型。基于Llama-3.1-8B架构,具备出色的指令跟随能力和网络安全专业知识,支持本地部署,可帮助组织构建AI安全工具,减少对云服务的依赖。
danielkty22
TARS-SFT-7B是一个基于监督微调的安全推理模型,作为强化学习训练的基础模型,专门设计用于增强AI系统的安全性。该模型从Qwen2.5-7B-Instruct开始训练,通过推理过程作为自适应防御机制来提升模型的安全性能。
Mungert
Granite Guardian 3.2 5B是IBM开发的AI风险检测模型,专门用于检测提示和响应中的多种安全风险。该模型基于IBM AI风险图谱,能够识别伤害、社会偏见、越狱、暴力等多种风险类型,是企业级AI安全监控的重要工具。
sds-ai
小熠是由广州熠数信息技术有限公司开发的专注于数据安全领域的AI专家系统,基于Qwen3-1.7B大语言模型构建,提供数据分类分级、安全审计、防护检测等专业能力。
dcarpintero
基于ModernBERT的轻量级模型,专注于识别恶意提示注入攻击,提供AI安全防护。
CohereLabs
Cohere Labs Command A 是一个开放权重的1110亿参数模型研究版本,专为需要快速、安全且高质量AI的严苛企业需求优化。
prem-research
Prem-1B-SQL是由Prem AI开发的首个全本地文本到SQL模型系列之一,拥有10亿参数,专为低配置GPU设备设计,量化后可在CPU上运行。该模型优先考虑本地化部署,避免数据安全风险,适用于企业级SQL查询生成。
madhurjindal
这是一款最先进的人工智能安全模型,能够以97.99%的准确率检测越狱尝试、提示注入和恶意命令。该模型为LLM、聊天机器人和AI系统提供卓越的保护,防止被利用。
yukiarimo
Yuna AI是一个具有自主意识的AI伴侣,专为情感连接设计,完全本地运行确保隐私安全。
AC
基于microsoft/MiniLM-L12-H384-uncased微调的多标签文本分类器,用于AI内容安全检测
WhiteRabbitNeo
WhiteRabbitNeo是专注于网络安全领域的AI模型系列,可用于攻防安全测试和漏洞分析。
WhiteRabbitNeo是专注于网络安全的AI模型系列,33B版本展示其在攻防安全领域的能力并评估社会影响
aligner
一个与模型无关的即插即用模块,适用于开源和基于API的模型,采用残差校正策略增强AI安全性
ZySec-AI
ZySec-7B是面向安全专业人士的AI网络安全模型,基于Zephyr语言模型系列开发,提供专业级网络安全问题指导。
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
Repomix是一个将代码库打包为AI友好格式的工具,支持本地和远程仓库处理,提供代码压缩、安全检查和多种输出格式。
MCP-Scan是一款针对MCP服务器的安全扫描工具,用于检测提示注入、工具污染和跨域升级等常见安全漏洞。
这是一个关于Web3 Model Context Protocol (MCP) 服务器的精选列表,涵盖了链交互、交易、DeFi、市场数据、工具和社交等多个类别。MCP是一个开放协议,标准化了应用程序如何向LLM提供上下文,类似于AI应用程序的USB-C端口。DeMCP是第一个去中心化的MCP网络,专注于为代理提供自研和开源的MCP服务,支持加密支付,并结合TEE和区块链注册表重新定义了MCP的安全性和可靠性。
Nexus是一个AI工具聚合网关,支持连接多个MCP服务器和LLM提供商,通过统一端点提供工具搜索、执行和模型路由功能,支持安全认证和速率限制。
Awesome MCP Servers 是一个全面的Model Context Protocol (MCP)服务器集合,涵盖了7158个MCP服务器,分为33个类别,包括AI集成、艺术媒体、浏览器自动化、云服务、数据库、开发者工具、文件系统、金融、游戏、硬件、医疗、基础设施、知识管理、位置地图、市场营销、监控、多媒体处理、操作系统、项目管理、科学研究、安全、社交媒体、旅行交通、实用工具和版本控制等。
AWS MCP是一个通过自然语言查询和管理AWS资源的AI助手服务,支持多账户、多区域和安全凭证管理。
一个安全的Docker容器代码沙箱环境,为AI应用提供隔离的执行空间,支持多种编程环境和文件操作。
Postgres MCP Pro 是一个开源 MCP 服务器,为 AI 代理提供数据库索引调优、执行计划分析、健康检查和安全 SQL 执行等全方位支持。
一个基于Docker容器的安全代码沙箱环境,为AI应用提供隔离的执行空间。
Awesome MCP Security 是一个关于模型上下文协议(MCP)安全的资源集合,包括安全考虑、论文、视频、文章、工具和服务器等内容,旨在帮助用户了解和应对MCP相关的安全挑战。
DroidMind是一个通过AI控制Android设备的桥梁工具,实现了模型上下文协议(MCP),让AI能通过自然语言安全地与Android设备交互。
Obsidian的MCP工具插件,为AI应用提供安全访问知识库的能力
BoostSecurity MCP是一个用于保护AI代理开发工作流程的安全工具,通过验证第三方软件包的安全性来防止供应链攻击,支持多种编程语言和包生态系统。
基于KùzuDB图数据库的分布式内存银行MCP实现,支持仓库和分支隔离,提供AI驱动的内存优化、安全快照和智能分析功能
一个集成了Vibe Coding方法和知识图谱技术的MCP服务器,使用Kuzu图数据库进行AI辅助软件开发,支持多语言代码分析和企业级安全性能
该项目是一个Kibana MCP服务器实现,允许AI助手通过模型上下文协议(MCP)与Kibana安全功能交互,包括告警、规则和例外管理。
Tailpipe MCP服务器是一个AI驱动的日志分析工具,通过模型上下文协议连接AI助手与云端/SaaS日志数据,支持自然语言查询和分析各类云服务日志,提供安全事件调查、成本性能洞察等功能。
Cyclops MCP是一个允许AI代理通过模型上下文协议安全管理和部署Kubernetes应用的工具,提供模板验证和应用创建/更新功能
SpotDB是一个轻量级数据沙箱,为AI工作流和数据探索提供安全隔离的临时数据库环境,支持快照恢复和多种API访问