Anthropic 全新 AI 模型 Claude Neptune 即將亮相,競逐市場巨頭
科技媒體 testingcatalog 發透露了 AI 公司 Anthropic 正在研發的新模型 Claude Neptune 的相關信息。目前,這一新 AI 模型已進入內部安全測試階段,預計將與 OpenAI 的 GPT-5及谷歌的 Gemini Ultra 展開競爭。根據博文的介紹,Claude Neptune 的安全測試正在使用 Anthropic Workbench 平臺進行。這一階段主要進行紅隊演習,旨在評估模型抵禦越獄攻擊的能力。紅隊演習將於5月18日結束,測試的重點在於 constitutional classifiers 系統,這是該模型安全協議的核心,特別關注對越獄嘗試的防範。初步測試結果顯示,相較於