["OpenAI声称《纽约时报》雇黑客攻击ChatGPT","OpenAI主张《纽约时报》雇黑客是关键","《纽约时报》使用提示词攻击ChatGPT","OpenAI反击公然违反产品使用条款","AI公司面临类似谷歌版权诉讼危机","互联网公司出售数据给AI公司","最新数据选择研究框架提议","AI生成内容加速铺开在互联网上","大模型承认使用AI生成的数据","文心一言等中文数据也重要"]
["随着LLM应用日益广泛,提升其安全性迫在眉睫","提示词攻击直接影响LLM执行准确性与系统安全性","介绍众多对抗性提示词攻击手段实例","红队演练可增强LLM对抗攻击能力","用户应提高网络安全防范意识"]
Anthropic
$7
Input tokens/M
$35
Output tokens/M
200
Context Length
Bytedance
-
Alibaba
Minimax
Tencent
$100
leolee99
PIGuard是一种新型的提示防护模型,专门用于检测提示注入攻击。通过创新的训练策略显著减少对触发词的偏差,在多个基准测试中表现出色,超越现有最佳模型30.8%,为LLM安全提供强大的开源防护解决方案。
GenTelLab
GenTel-Shield是一个专注于检测和防御提示词注入攻击的模型,能够有效区分恶意样本与良性样本。