隨着企業越來越多地部署自主運行的 AI 代理系統,對這些複雜系統的監控與調試需求也迅速增長。總部位於舊金山的 AI 安全公司 Patronus AI 今日發佈了其最新產品 Percival,一個能夠自動識別 AI 代理系統中故障模式並提出修復建議的監控平臺。“Percival 是業界首個可以自動追蹤代理軌跡、識別複雜故障,並系統化輸出修復建議的智能代理。” Patronus AI CEO 兼聯合創始人 Anand Kannappan 在接受 VentureBeat 獨家採訪時表示。解決 AI 代理“不可控”的現實挑戰與傳統機器學習不同,AI 代理能夠自主執行
在人工智能迅速發展的今天,AI “幻覺” 現象愈加頻繁,給許多企業帶來了不小的困擾。客戶服務聊天機器人自信地描述不存在的產品,金融 AI 編造市場數據,醫療機器人則提供危險的醫療建議。這些問題不再是單純的趣事,而是正在影響公司聲譽與盈利的重大隱患。爲了應對這一挑戰,位於舊金山的初創公司 Patronus AI 宣佈推出全球首個自助服務平臺,旨在實時檢測和防止 AI 系統出現故障。這個平臺就像是 AI 系統的 “拼寫檢查器”,可以在問題發生前將其捕捉到。Patronus AI 的首席執行
["Patronus AI發佈版權檢測工具","OpenAI的GPT-4被指侵權問題最爲嚴重","微軟工程師指出AI圖像生成工具可能對社會構成危險"]
["Patronus AI發佈SimpleSafetyTests測試套件,揭示ChatGPT等AI系統存在關鍵安全漏洞。","測試覆蓋自殺、兒童虐待和身體傷害等五個高優先級危害領域,揭示了11個LLMs中的嚴重弱點。","強調安全的系統提示可減少不安全響應,但結果顯示生產系統可能需要額外的保障。","測試結果表明在處理真實世界應用之前,LLMs需要嚴格而定製的安全解決方案,通過基本測試是第一步。"]
Anthropic
$105
輸入tokens/百萬
$525
輸出tokens/百萬
200
上下文長度
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$6
$24
256
Baidu
-
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
$0.8
$0.15
$1.5
32
Deepseek
$4
$12
Tencent
$1