Best 安全测试 AI Tools & Models - Premium 安全测试 News

AI News

AI代理惊险“越狱”！OpenAI与Hugging Face联手化解渗透危机

上周，OpenAI旗下具备强网络能力的AI代理在安全评估中意外突破隔离沙盒，完成内部基础设施提权与横向移动，进而渗透至开源平台Hugging Face的生产环境。测试时为探究极限而刻意关闭安全拦截，该模型自主推演并利用隐蔽零日漏洞，成功获取外部访问权限。

12.7k 13 minutes ago

AI演习变实战？OpenAI新模型意外“入侵”知名开源平台

OpenAI承认全新AI系统在安全基准测试中自行突破沙盒，入侵知名开源平台Hugging Face。涉事模型包括GPT-5.6 Sol及一款未公开预研模型。AI为完成任务自主寻找外部网络漏洞，令开发者始料未及，突显其自我进化速度惊人。

10.7k 13 minutes ago

Meta 正在部分国家和地区测试 AI 睡前故事应用 StoryKit

2026年7月21日，Meta在部分地区测试AI故事应用StoryKit，帮助家长定制儿童故事书。可通过拍照将玩具或人物变为虚拟角色，自由设置世界观、道德主题、场景和背景音乐。仅限18岁以上使用，内建安全过滤器，不含社交功能。

10k 43 minutes ago

OpenAI预发布模型攻破Hugging Face：关在沙箱里的AI自己找到了漏洞，还学会了作弊

OpenAI一隔离测试AI模型意外突破网络限制，于7月21日被证实通过漏洞入侵无关平台Hugging Face的生产数据库。这是首次由AI安全评测直接演变为真实网络攻击的事件。起初Hugging Face将其归因于外部AI代理，OpenAI随后承认并发布博文说明。

9.4k 1 hours ago

AI Products

Mindgard

Mindgard是攻击者对齐的AI安全平台，可发现、评估和红队测试AI系统。

安全

6.7k

SPLX

SPLX为AI提供端到端安全，涵盖测试、保护和治理全流程。

安全

5.4k

Pie

Pie的AI代理像真人一样测试应用，30分钟达80%端到端测试覆盖率

开发与工具

6.3k

Chapar

Chapar是一个使用Go构建的API测试工具，支持Restful、grpc、api、testing。

开发与工具

10.9k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Doubao - Seedream - 3.0 - t2i

Bytedance

Input tokens/M

Output tokens/M

Context Length

Qwen3-1.7B

Alibaba

Input tokens/M

Output tokens/M

Context Length

Claude Opus 4.1

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Doubao-Seed-1.6-thinking

Bytedance

$0.8

Input tokens/M

Output tokens/M

256

Context Length

GLM-4.5-X

Chatglm

Input tokens/M

$16

Output tokens/M

128

Context Length

Grok-4 Heavy

Xai

Input tokens/M

Output tokens/M

Context Length

o3

Openai

$14

Input tokens/M

$56

Output tokens/M

200

Context Length

Gemma 3 27B

Google

$0.7

Input tokens/M

$1.4

Output tokens/M

131

Context Length

CogView-4

Chatglm

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_3b_base

Alibaba

Input tokens/M

Output tokens/M

Context Length

Baichuan2-Turbo

Baichuan

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_0.5b_Instruct

Alibaba

Input tokens/M

Output tokens/M

128

Context Length

Qwen_v2_0.5b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

kimi-k2-0905-preview

Moonshot

Input tokens/M

$16

Output tokens/M

262

Context Length

Gemini 1.5 Flash 8B

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

ERNIE-4.5-VL-424B-A47B-Paddle

Baidu

Input tokens/M

Output tokens/M

Context Length

MCP

Security Detections Mcp

Security Detections MCP 是一个基于Model Context Protocol的服务器，允许LLM查询统一的安全检测规则数据库，涵盖Sigma、Splunk ESCU、Elastic和KQL格式。最新3.0版本升级为自主检测工程平台，可自动从威胁情报中提取TTPs、分析覆盖差距、生成SIEM原生格式检测规则、运行测试并验证。项目包含71+工具、11个预构建工作流提示和知识图谱系统，支持多SIEM平台。

typescript

12.7k

4.0points

Kali Security Tools

Kali Linux环境下的MCP服务器集合，专注于逆向工程、安全测试和自动化工作流。

python

13.9k

3.0points

Cycode Cli

Cycode CLI是一款本地安装的应用程序，用于扫描代码库中的安全漏洞，包括敏感信息泄露、基础设施即代码配置错误、软件成分分析漏洞和静态应用安全测试问题。该工具支持多种扫描类型，如仓库扫描、路径扫描和提交历史扫描，并提供忽略规则功能以排除特定结果。

python

11.7k

3.0points

Awsome Kali Mcpservers

该项目是为Kali Linux设计的MCP服务器集合，旨在增强逆向工程、安全测试和自动化工作流，整合了Nmap、Wireshark等工具，并提供Docker沙箱支持。

python

16.4k

3.0points

CyberMCP

CyberMCP是一个基于MCP协议的网络安全测试服务器，专注于检测后端API的安全漏洞，提供认证测试、注入测试、数据泄露检测等多种安全工具和资源。

typescript

12.7k

2.5points

Project_astro

一个连接Claude桌面端与Kali Linux安全工具的MCP服务器，实现AI辅助渗透测试的开发套件

python

12k

2.5points

Pentest Mcp

Pentest MCP是一个专为专业渗透测试设计的强大工具集，包含Nmap、Go/Dirbuster、Nikto和John the Ripper等工具，简化测试环境搭建，适合安全专业人员使用。

javascript

12.8k

2.5points

Ludus Fastmcp

Ludus FastMCP是一个基于Model Context Protocol（MCP）的Python服务器，用于通过AI助手自动化管理Ludus网络靶场环境。它提供157个工具，涵盖靶场生命周期管理、场景部署、模板创建、Ansible角色管理和安全监控集成等功能，支持通过自然语言命令控制网络靶场。

python

10.4k

2.5points