Anthropic 全新 AI 模型 Claude Neptune 即将亮相,竞逐市场巨头
科技媒体 testingcatalog 发透露了 AI 公司 Anthropic 正在研发的新模型 Claude Neptune 的相关信息。目前,这一新 AI 模型已进入内部安全测试阶段,预计将与 OpenAI 的 GPT-5及谷歌的 Gemini Ultra 展开竞争。根据博文的介绍,Claude Neptune 的安全测试正在使用 Anthropic Workbench 平台进行。这一阶段主要进行红队演习,旨在评估模型抵御越狱攻击的能力。红队演习将于5月18日结束,测试的重点在于 constitutional classifiers 系统,这是该模型安全协议的核心,特别关注对越狱尝试的防范。初步测试结果显示,相较于