尴尬!Meta 的 AI 安全系统被 “空格”攻击轻松绕过
Meta 发布的 Prompt-Guard-86M 模型旨在防御提示注入攻击,通过限制大型语言模型处理不当输入,保护系统安全。然而,该模型自身也暴露出被攻击的风险。Aman Priyanshu 研究发现,通过在输入中添加空格等简单字符间隔或去除标点符号,模型会忽视先前的安全指令,攻击成功率接近100%。这一发现突显了 AI 安全性的重要性,尽管 Prompt-Guard 只是防线的一部分,但它揭示了企业在使用 AI 时面临的潜在威胁。Meta 正在积极寻找解决方案以增强模型的安全性。