大規模言語モデルと視覚言語モデルの脆弱性と保護策を探求する
madhurjindal
これは最先端の人工知能セキュリティモデルで、97.99%の精度で越狱試行、プロンプト注入、悪意のあるコマンドを検出できます。このモデルは、LLM、チャットボット、AIシステムを悪用から保護します。
jackhhao
bert-base-uncasedをファインチューニングしたテキスト分類モデルで、ユーザープロンプト内のジェイルブレーク試行を検出するために使用されます
ツールの制限や概念の欠如を突破し、モデルコンテキストプロトコルを完全に使用するためのMCPサーバーラッパーツールです。