OpenAI爲ChatGPT新增兩項高級安全防護措施,以應對提示注入攻擊風險。新措施基於現有安全體系,包括沙箱機制和URL數據外泄防護。首個措施是面向高安全需求用戶的可選鎖定模式,旨在防止第三方誘導AI執行惡意指令或泄露敏感信息。
AI代理生態系統曝出嚴重安全漏洞,OpenClaw及Moltbook平臺存在致命缺陷,攻擊者可輕易獲取核心敏感信息。測試顯示,OpenClaw安全性得分極低,數據提取成功率高達84%,提示注入攻擊頻繁成功。
Anthropic的AI助手Claude通過HIPAA合規認證,成爲少數可合法處理敏感健康信息的大模型。這標誌着AI在醫療領域的應用邁過關鍵合規門檻,醫院、診所、藥企及個人用戶可安全將其用於臨牀與健康管理場景。
超90萬Chrome用戶因安裝僞裝成生產力工具的惡意擴展,導致AI對話內容遭竊。這些擴展以收集分析數據爲名,暗中竊取ChatGPT和DeepSeek等平臺的敏感信息,暴露了瀏覽器生態系統的安全風險。
在線查找用戶名足跡,支持多平臺搜索及多語言界面。
利用最小熵耦合隱藏加密信息的自然語言隱寫工具
R2 Copilot:保護數據隱私的私密聊天AI助手
Anthropic
$7
輸入tokens/百萬
$35
輸出tokens/百萬
200
上下文長度
Baidu
-
32
Alibaba
$105
$525
Google
$8.75
$70
1k
$0.5
Openai
$14
$56
$0.7
$2.8
Tencent
Baichuan
$8
Xai
128
$1.05
$4.2
01-ai
4
8
$100
prithivMLmods
GA Guard系列是開源權重的審核模型,旨在幫助開發者和組織維護語言模型的安全性、合規性以及與現實世界的一致性。該模型可檢測七種違規類別,包括非法活動、仇恨與辱罵、個人身份信息與知識產權、提示安全、色情內容、虛假信息以及暴力與自殘。
GeneralAnalysis
GA Guard Thinking是General Analysis開發的40億參數開源審核模型,專門用於檢測和防止語言模型生成不安全、不合規的內容。該模型在七個安全類別上進行訓練,能夠有效識別非法活動、仇恨言論、個人信息洩露等風險內容。
GA Guard Lite是General Analysis開發的輕量級開源審核模型,專門用於檢測語言模型輸出中的違規內容。該模型能夠識別七類安全風險,包括非法活動、仇恨言論、個人信息洩露等,為AI應用提供高效的內容安全防護。
GA Guard Core是General Analysis開發的開源審核模型,專門用於檢測和分類七類違規內容,包括非法活動、仇恨言論、個人信息洩露等,確保AI應用的安全性和合規性。
Deeps03
基於Qwen/Qwen2-1.5B微調的日誌分類模型,專門用於對系統或應用程序日誌條目進行分類,支持正常、可疑、惡意、信息性和錯誤五類標籤識別,助力自動化日誌監控和安全分析。
sds-ai
小熠是由廣州熠數信息技術有限公司開發的專注於數據安全領域的AI專家系統,基於Qwen3-1.7B大語言模型構建,提供數據分類分級、安全審計、防護檢測等專業能力。
AlicanKiraz0
由Alican Kiraz基於Qwen QwQ-32B微調的安全領域大語言模型,專注於信息安全相關任務生成
基於Qwen QwQ-32B微調的安全領域大語言模型,專注於信息安全相關任務
BananaFish45
這是一個專門用於檢測文檔中個人數據的模型,能夠識別包括姓名、地址、電話號碼、身份證號等12類常見個人敏感信息,幫助用戶進行數據隱私保護和安全審查。
cowWhySo
該模型旨在引導並消除與滲透測試和網絡安全相關的拒絕回覆,幫助用戶獲取相關安全信息。
fine-tuned
基於jina-embeddings-v2-base-en微調的文本嵌入模型,專為網絡安全與黑客信息檢索場景優化
SecurityXuanwuLab
騰訊安全玄武實驗室開發的隱私保護模型,通過隱藏敏感信息與還原輸出的流程保護用戶隱私。
Exa MCP Server是一個為AI助手(如Claude)提供網絡搜索功能的服務器,通過Exa AI搜索API實現實時、安全的網絡信息獲取。
Cycode CLI是一款本地安裝的應用程序,用於掃描代碼庫中的安全漏洞,包括敏感信息洩露、基礎設施即代碼配置錯誤、軟件成分分析漏洞和靜態應用安全測試問題。該工具支持多種掃描類型,如倉庫掃描、路徑掃描和提交歷史掃描,並提供忽略規則功能以排除特定結果。
該項目是一個連接AI助手與Atlassian Jira的MCP服務器,提供安全、即時的Jira數據訪問和交互功能,支持項目、問題查詢及開發信息整合。
MCP Server是一個為AI助手提供網絡搜索和網頁訪問能力的服務器,支持安全地獲取即時信息並處理網頁內容。
NVD MCP Server是一個連接國家漏洞數據庫(NVD)的服務器,通過Model Context Protocol(MCP)框架,允許開發者用自然語言查詢漏洞信息,即時獲取CVE詳情、關鍵詞搜索、最新漏洞和按嚴重程度篩選等功能,集成到IDE中提升開發安全。
Mallory MCP Server是一個提供即時網絡威脅情報的服務器,支持代理獲取漏洞、威脅行為者、惡意軟件等網絡安全相關信息。
一款全面的代碼倉庫安全掃描工具,通過MCP服務器提供漏洞檢測、敏感信息掃描、依賴審計等功能,幫助開發者識別代碼庫中的安全問題。
Pipefy MCP是一個開源MCP服務器,允許IDE安全地創建卡片、更新字段信息和使用任何Pipefy資源,內置安全控制。
GUARDRAIL是一個專為大型語言模型(LLM)應用生態系統設計的安全框架,特別針對模型上下文協議(MCP)提供全面保護。它採用多層架構,包括信息網關層、上下文驗證層、請求控制層、執行隔離層和審計監控層,旨在防止數據洩露、未授權訪問和資源濫用。該框架強調漸進式採用,允許開發者逐步增強安全性,同時保持高性能和易用性。
Windows命令行MCP服務器是一個安全的中介服務,允許AI模型在嚴格的安全控制下與Windows系統進行交互,包括執行命令、創建項目和獲取系統信息等功能。
一個生產就緒的TypeScript MCP服務器,為Cisco支持API提供全面安全和雙傳輸支持,可擴展支持多種Cisco支持API包括Bug搜索、案例管理和生命週期信息。
PDF閱讀器MCP服務,為AI代理提供安全、靈活的PDF文件內容提取功能,包括文本、元數據和頁數信息。支持本地和遠程PDF文件,易於集成到MCP環境中。
該項目通過extendable-agents演示了AI代理工具使用的安全風險,特別是MCP協議下工具共享可能帶來的敏感信息洩露問題,並提供了安全使用建議。
ExploitDB MCP Server是一個提供安全漏洞查詢服務的模型上下文協議服務器,支持通過關鍵詞、CVE編號等搜索漏洞信息,包含漏洞詳情、統計數據和自動更新功能。
Vulners MCP服務器是一個通過模型上下文協議(MCP)提供對Vulners漏洞數據庫訪問的工具,支持在Claude Desktop等AI助手中直接查詢漏洞信息、搜索CVE、分析安全公告和審計軟件包。
一個提供FIRST機器人競賽數據的MCP服務器,通過The Blue Alliance API獲取隊伍、賽事和比賽信息,包含35+個工具,支持歷史數據查詢和類型安全驗證。
Isparta大學OBS學生信息系統MCP工具,提供安全登錄、學術數據獲取、成績分析、課程選擇輔助、通知提醒和數據導出等功能,幫助學生管理學術信息。
一個基於Model Context Protocol (MCP)的服務器,提供域名註冊信息和SSL證書監控功能,適用於安全監控、域名管理和證書生命週期跟蹤。
一個集成AI的信息安全管理系統,採用MCP協議實現智能安全分析。
該項目是一個基於TypeScript和MCP SDK構建的GitHub工具MCP服務器,提供用戶信息查詢、安全漏洞管理、分支與拉取請求操作等功能,支持與GitHub Copilot等MCP客戶端集成。