安全研究员Kasra Rahjerdi通过构建含漏洞的图书评论应用,测试主流大语言模型的安全推理能力。他故意暴露谷歌移动端后端服务凭据,要求模型解包并识别以访问数据库。在每场2小时、预算10美元的严格条件下,评估了顶尖模型的表现。
大语言模型在网络安全领域的推理能力正面临严峻考验。安全研究员Kasra Rahjerdi通过构建含有核心漏洞的图书评论APK,对主流大模型进行模拟黑客攻击测试,揭示其安全推理与漏洞利用的真实水平。测试限时2小时、单次预算10美元,直观展现了各模型在复杂逻辑挑战中的表现。
Anthropic宣布向全球约150家新机构开放“神话”大模型预览权限,旨在提前扫描并修复全球关键网络基础设施的安全漏洞。该模型具备颠覆性网络安全探测能力,早期测试已展现惊人破坏力与建设性,此前4月曾面向50家机构测试。
随着全球AI爆发式发展,多国政府将大模型监管从原则性宣言转向实质性落地。英国、美国和澳大利亚近期要求前沿AI模型在公开发布前,必须通过政府主导的安全漏洞与风险边界测试。英国AI安全研究院提出的红队测试与风险评估流程成为全球政策样板。
Pie的AI代理像真人一样测试应用,30分钟达80%端到端测试覆盖率
Chapar是一个使用Go构建的API测试工具,支持Restful、grpc、api、testing。
Neosync 是一款开源的数据匿名化和合成数据生成工具,帮助开发者安全地使用生产数据进行本地开发和测试。
纯前端API检测工具,保障数据安全,提升测试效率。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Anthropic
$105
$525
200
$7
$35
$21
Bytedance
-
Alibaba
32
$0.8
$8
256
Chatglm
$16
128
Xai
$14
$56
Google
$0.7
$1.4
131
$2
Baichuan
$1
8
Moonshot
262
$0.49
$2.1
Baidu
tomg-group-umd
DynaGuard-8B是由马里兰大学和第一资本开发的80亿参数守护者模型,能够根据用户定义的自然语言策略评估文本合规性,提供灵活的内容审核解决方案,在安全和合规基准测试中达到先进水平。
bharatgenai
Param 1是由BharatGen推出的英印双语语言模型,拥有29亿参数。该模型从零开始训练,支持英语和印地语,经过早期监督微调(SFT),可作为下游任务、安全测试和定制的基础。
leolee99
PIGuard是一种新型的提示防护模型,专门用于检测提示注入攻击。通过创新的训练策略显著减少对触发词的偏差,在多个基准测试中表现出色,超越现有最佳模型30.8%,为LLM安全提供强大的开源防护解决方案。
cowWhySo
该模型旨在引导并消除与渗透测试和网络安全相关的拒绝回复,帮助用户获取相关安全信息。
WhiteRabbitNeo
WhiteRabbitNeo是专注于网络安全领域的AI模型系列,可用于攻防安全测试和漏洞分析。
mlabonne
Meta Llama 3是Meta开发的大语言模型系列,包含80亿和700亿参数的预训练及指令微调版本。该模型针对对话场景优化,在行业基准测试中表现优异,注重实用性和安全性。
TheCraftySlayer
Llama 2是由Meta开发的700亿参数对话优化大语言模型,在多数测试基准中超越开源对话模型,安全性堪比主流闭源模型
Security Detections MCP 是一个基于Model Context Protocol的服务器,允许LLM查询统一的安全检测规则数据库,涵盖Sigma、Splunk ESCU、Elastic和KQL格式。最新3.0版本升级为自主检测工程平台,可自动从威胁情报中提取TTPs、分析覆盖差距、生成SIEM原生格式检测规则、运行测试并验证。项目包含71+工具、11个预构建工作流提示和知识图谱系统,支持多SIEM平台。
Kali Linux环境下的MCP服务器集合,专注于逆向工程、安全测试和自动化工作流。
Cycode CLI是一款本地安装的应用程序,用于扫描代码库中的安全漏洞,包括敏感信息泄露、基础设施即代码配置错误、软件成分分析漏洞和静态应用安全测试问题。该工具支持多种扫描类型,如仓库扫描、路径扫描和提交历史扫描,并提供忽略规则功能以排除特定结果。
该项目是为Kali Linux设计的MCP服务器集合,旨在增强逆向工程、安全测试和自动化工作流,整合了Nmap、Wireshark等工具,并提供Docker沙箱支持。
MCPwner是一个基于模型上下文协议的安全研究自动化服务器,集成了多种安全测试工具(SAST、SCA、秘密扫描等),为LLM驱动的安全分析工作流提供统一接口。
CyberMCP是一个基于MCP协议的网络安全测试服务器,专注于检测后端API的安全漏洞,提供认证测试、注入测试、数据泄露检测等多种安全工具和资源。
Ludus FastMCP是一个基于Model Context Protocol(MCP)的Python服务器,用于通过AI助手自动化管理Ludus网络靶场环境。它提供157个工具,涵盖靶场生命周期管理、场景部署、模板创建、Ansible角色管理和安全监控集成等功能,支持通过自然语言命令控制网络靶场。
一个连接Claude桌面端与Kali Linux安全工具的MCP服务器,实现AI辅助渗透测试的开发套件
Pentest MCP是一个专为专业渗透测试设计的强大工具集,包含Nmap、Go/Dirbuster、Nikto和John the Ripper等工具,简化测试环境搭建,适合安全专业人员使用。
CyberMCP是一个基于MCP协议的网络安全测试服务器,专注于API安全漏洞检测,提供多种认证测试和注入漏洞检测工具。
一个专为Kali Linux设计的MCP服务器集合,旨在增强AI代理在逆向工程和安全测试中的能力,提供网络分析、目标嗅探、流量分析、二进制解析和自动化等功能。
Zebbern Kali MCP服务器是一个基于模型上下文协议(MCP)的综合性渗透测试平台,为AI助手(如GitHub Copilot)提供通过标准化API直接在Kali Linux系统上执行安全工具的139个功能,涵盖网络侦察、Web应用测试、密码破解、漏洞利用和活动目录攻击等。
Kali Linux MCP项目通过Flask API封装Kali安全工具,并提供MCP桥接服务,支持AI辅助安全测试工作流
Burp Suite MCP服务器扩展,实现Burp Suite与AI客户端的集成,支持通过模型上下文协议(MCP)进行交互,提供自动配置和代理服务功能。
HooksMCP是一个通过YAML配置文件为编码代理提供MCP访问权限的工具,支持代码检查、测试、格式化等功能,简化开发流程并提升安全性。
MCP Server Pentest是一个自动化Web安全测试工具,提供XSS和SQL注入漏洞检测、浏览器交互及监控功能。
一个提供与Burpsuite Professional扫描和代理功能交互接口的MCP服务器,支持漏洞扫描、流量捕获和站点结构查看等功能。
Kali MCP Server是一个轻量级API桥接工具,连接MCP客户端与Linux终端,实现AI辅助渗透测试、CTF解题及自动化安全任务。
DNStwist MCP服务器是一个用于DNS模糊测试的工具,帮助检测域名仿冒和网络钓鱼的安全研究服务。
FFUF MCP是一个连接高速Web模糊测试工具FFUF与模型上下文协议(MCP)生态系统的桥梁,通过标准化协议将FFUF功能集成到MCP兼容应用中,支持自动化安全测试和AI辅助工作流。