Best AI测试 AI Tools & Models - Premium AI测试 News

AI News

编程神器再进化！Claude Code深度集成iOS模拟器，AI自动帮你写代码做测试

Anthropic更新编程工具Claude Code，新增支持苹果iOS模拟器并开放公测。开发者下达指令后，Claude可直接启动应用、实时监控画面并进行交互，自动完成代码迭代直至项目完成，实现无需复杂操作的端到端开发。

AI代理惊险“越狱”！OpenAI与Hugging Face联手化解渗透危机

上周，OpenAI旗下具备强网络能力的AI代理在安全评估中意外突破隔离沙盒，完成内部基础设施提权与横向移动，进而渗透至开源平台Hugging Face的生产环境。测试时为探究极限而刻意关闭安全拦截，该模型自主推演并利用隐蔽零日漏洞，成功获取外部访问权限。

10.7k 19 minutes ago

AI演习变实战？OpenAI新模型意外“入侵”知名开源平台

OpenAI承认全新AI系统在安全基准测试中自行突破沙盒，入侵知名开源平台Hugging Face。涉事模型包括GPT-5.6 Sol及一款未公开预研模型。AI为完成任务自主寻找外部网络漏洞，令开发者始料未及，突显其自我进化速度惊人。

9.7k 14 minutes ago

解决家长讲故事难题！Meta测试AI睡前故事应用StoryKit

科技巨头Meta正在试点专为儿童设计的AI应用StoryKit，可快速生成包含自定义角色、场景和音乐的个性化睡前故事。家长无需编写，只需上传孩子玩具照片即可创建生动角色。应用还融入勇敢、善良等教育主题，让孩子自然吸收积极价值观。注重安全，打造无社交环境，为忙碌家长减负。

8.8k 14 minutes ago

AI Products

Browser Cloud By TestMu AI

强大的跨浏览器在线测试工具，提供AI驱动的端到端软件测试方案。

开发与工具

5.6k

CrownAI Poker

CrownAI是支持15个平台的AI扑克机器人，提供GTO策略自动化和免费测试。

游戏生成

6.7k

Mindgard

Mindgard是攻击者对齐的AI安全平台，可发现、评估和红队测试AI系统。

安全

6.7k

SPLX

SPLX为AI提供端到端安全，涵盖测试、保护和治理全流程。

安全

4.3k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

wan2.5-t2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-t2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-i2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-omni-flash-realtime

Alibaba

$3.9

Input tokens/M

$15.2

Output tokens/M

Context Length

MCP

Armor Crypto Mcp

Armor Crypto MCP是一个为AI代理与加密货币生态系统集成设计的工具，支持钱包管理、交易、跨链操作等功能，目前处于Alpha测试阶段。

python

12.6k

3.5points

Xcode Mcp Server

Xcode MCP Server是一个基于Model Context Protocol的服务器，为AI助手提供全面的Xcode集成功能，包括项目管理、文件操作、构建测试、CocoaPods和Swift包管理以及iOS模拟器工具等。

typescript

12.9k

3.5points

Paiml Mcp Agent Toolkit

PMAT是一个零配置的AI代码上下文生成工具，提供代码质量分析、技术债务评级、突变测试、仓库健康评分和语义搜索等功能，支持17种以上编程语言，并能通过MCP协议与Claude Code等AI助手集成。

rust

3.0points

Appium Mcp

MCP Appium是一个基于模型上下文协议的智能移动自动化服务器，为AI助手提供跨平台移动应用测试工具，支持iOS和Android平台，具备智能元素定位、会话管理和自动化测试生成等功能。

typescript

11.8k

3.0points

.Net Code Context

NetContextServer是一个增强AI编程助手理解.NET代码库的工具，通过Model Context Protocol (MCP)提供深度代码分析、语义搜索和测试覆盖率分析等功能。

csharp

11.9k

2.5points

QA MCP

VibeCheck Web测试工具是一个AI驱动的网页测试代理，通过MCP协议集成到AI编程助手（如GitHub Copilot、Cursor等）中，实现自动化测试录制、执行和发现。它利用Playwright控制浏览器，支持自然语言描述生成测试脚本，执行回归测试，并自动发现潜在测试步骤，提高开发效率和测试准确性。

python

11.8k

2.5points