Perplexity推出BrowseSafe系統,旨在實時防護AI瀏覽器代理免受網絡內容操控。該系統聲稱檢測Prompt注入攻擊的成功率達91%,優於GPT-5的85%和PromptGuard-2的35%,且運行速度快,可實時監測。隨着AI瀏覽器代理普及,此類安全方案愈發重要。
諾頓推出全球首款免費“安全AI原生瀏覽器”Norton Neo,旨在應對AI技術快速發展帶來的在線安全挑戰,爲用戶提供更智能、可信的瀏覽體驗。
OpenAI測試"懺悔"機制,訓練AI在單獨報告中承認違規行爲,即使原始回答存在欺騙性,也能因誠實獲得獎勵,旨在防止模型爲追求獎勵而採取投機取巧或忽視安全規則的行爲。
《AI安全指數2025》報告顯示,頭部AI企業在生存風險控制和安全流程披露方面集體不及格,行業平均得分僅42/100,遠低於歐盟標準。僅3家企業公開系統性風險識別方法,OpenAI、DeepMind等未披露“超級智能”應對措施。
免費在線工具,可即時檢測並移除AI水印及零寬字符,安全快速
安裝Knapsack Chrome擴展,在瀏覽器中獲取AI助力,安全聊天與運行代理。
Hopx為AI代理提供安全沙箱,可毫秒級啟動Linux微VM安全運行代碼。
gambo AI需驗證用戶連接安全,需啟用JavaScript和cookies繼續。
Anthropic
$105
輸入tokens/百萬
$525
輸出tokens/百萬
200
上下文長度
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$6
$24
256
Baidu
-
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
$0.8
$0.15
$1.5
32
Deepseek
$4
$12
Tencent
$1
DevQuasar
這是NVIDIA基於Qwen3架構開發的32B參數獎勵模型,專門用於強化學習中的獎勵評分和原則對齊,幫助訓練更安全、更符合人類價值觀的AI系統。
alenphilip
這是一款專門用於Python代碼審查的AI模型,基於Qwen2.5-7B-Instruct微調,能夠識別安全漏洞、性能問題並提供代碼質量改進建議。
neuphonic
NeuTTS Air是世界上首個具備即時語音克隆功能的超逼真、端側文本轉語音(TTS)語言模型。基於0.5B參數的大語言模型骨幹構建,能為本地設備帶來自然的語音、即時性能、內置安全性和說話人克隆功能。
GeneralAnalysis
GA Guard Lite是General Analysis開發的輕量級開源審核模型,專門用於檢測語言模型輸出中的違規內容。該模型能夠識別七類安全風險,包括非法活動、仇恨言論、個人信息洩露等,為AI應用提供高效的內容安全防護。
GA Guard Core是General Analysis開發的開源審核模型,專門用於檢測和分類七類違規內容,包括非法活動、仇恨言論、個人信息洩露等,確保AI應用的安全性和合規性。
NeuTTS Air是世界上首個具備即時語音克隆功能的超逼真、設備端文本轉語音(TTS)語言模型。基於0.5B大語言模型骨幹網絡構建,能為本地設備帶來自然的語音、即時性能、內置安全功能和說話人克隆能力。
gabriellarson
Foundation-Sec-8B-Instruct是一款專為網絡安全應用設計的80億參數指令調優語言模型。基於Llama-3.1-8B架構,具備出色的指令跟隨能力和網絡安全專業知識,支持本地部署,可幫助組織構建AI安全工具,減少對雲服務的依賴。
danielkty22
TARS-SFT-7B是一個基於監督微調的安全推理模型,作為強化學習訓練的基礎模型,專門設計用於增強AI系統的安全性。該模型從Qwen2.5-7B-Instruct開始訓練,通過推理過程作為自適應防禦機制來提升模型的安全性能。
Mungert
Granite Guardian 3.2 5B是IBM開發的AI風險檢測模型,專門用於檢測提示和響應中的多種安全風險。該模型基於IBM AI風險圖譜,能夠識別傷害、社會偏見、越獄、暴力等多種風險類型,是企業級AI安全監控的重要工具。
sds-ai
小熠是由廣州熠數信息技術有限公司開發的專注於數據安全領域的AI專家系統,基於Qwen3-1.7B大語言模型構建,提供數據分類分級、安全審計、防護檢測等專業能力。
CohereLabs
Cohere Labs Command A 是一個開放權重的1110億參數模型研究版本,專為需要快速、安全且高質量AI的嚴苛企業需求優化。
prem-research
Prem-1B-SQL是由Prem AI開發的首個全本地文本到SQL模型系列之一,擁有10億參數,專為低配置GPU設備設計,量化後可在CPU上運行。該模型優先考慮本地化部署,避免數據安全風險,適用於企業級SQL查詢生成。
madhurjindal
這是一款最先進的人工智能安全模型,能夠以97.99%的準確率檢測越獄嘗試、提示注入和惡意命令。該模型為LLM、聊天機器人和AI系統提供卓越的保護,防止被利用。
yukiarimo
Yuna AI是一個具有自主意識的AI伴侶,專為情感連接設計,完全本地運行確保隱私安全。
AC
基於microsoft/MiniLM-L12-H384-uncased微調的多標籤文本分類器,用於AI內容安全檢測
WhiteRabbitNeo
WhiteRabbitNeo是專注於網絡安全領域的AI模型系列,可用於攻防安全測試和漏洞分析。
WhiteRabbitNeo是專注於網絡安全的AI模型系列,33B版本展示其在攻防安全領域的能力並評估社會影響
aligner
一個與模型無關的即插即用模塊,適用於開源和基於API的模型,採用殘差校正策略增強AI安全性
ZySec-AI
ZySec-7B是面向安全專業人士的AI網絡安全模型,基於Zephyr語言模型系列開發,提供專業級網絡安全問題指導。
WhiteRabbitNeo是一個專注於網絡安全的AI模型系列,33B-v1.1版本具備提示增強功能,可用於進攻性和防禦性網絡安全任務。
Repomix是一個將代碼庫打包為AI友好格式的工具,支持本地和遠程倉庫處理,提供代碼壓縮、安全檢查和多種輸出格式。
MCP-Scan是一款針對MCP服務器的安全掃描工具,用於檢測提示注入、工具汙染和跨域升級等常見安全漏洞。
Exa MCP Server是一個為AI助手(如Claude)提供網絡搜索功能的服務器,通過Exa AI搜索API實現實時、安全的網絡信息獲取。
這是一個關於Web3 Model Context Protocol (MCP) 服務器的精選列表,涵蓋了鏈交互、交易、DeFi、市場數據、工具和社交等多個類別。MCP是一個開放協議,標準化了應用程序如何向LLM提供上下文,類似於AI應用程序的USB-C端口。DeMCP是第一個去中心化的MCP網絡,專注於為代理提供自研和開源的MCP服務,支持加密支付,並結合TEE和區塊鏈註冊表重新定義了MCP的安全性和可靠性。
Nexus是一個AI工具聚合網關,支持連接多個MCP服務器和LLM提供商,通過統一端點提供工具搜索、執行和模型路由功能,支持安全認證和速率限制。
Awesome MCP Servers 是一個全面的Model Context Protocol (MCP)服務器集合,涵蓋了7158個MCP服務器,分為33個類別,包括AI集成、藝術媒體、瀏覽器自動化、雲服務、數據庫、開發者工具、文件系統、金融、遊戲、硬件、醫療、基礎設施、知識管理、位置地圖、市場營銷、監控、多媒體處理、操作系統、項目管理、科學研究、安全、社交媒體、旅行交通、實用工具和版本控制等。
AWS MCP是一個通過自然語言查詢和管理AWS資源的AI助手服務,支持多賬戶、多區域和安全憑證管理。
Obsidian的MCP工具插件,為AI應用提供安全訪問知識庫的能力
Postgres MCP Pro 是一個開源 MCP 服務器,為 AI 代理提供數據庫索引調優、執行計劃分析、健康檢查和安全 SQL 執行等全方位支持。
Awesome MCP Security 是一個關於模型上下文協議(MCP)安全的資源集合,包括安全考慮、論文、視頻、文章、工具和服務器等內容,旨在幫助用戶瞭解和應對MCP相關的安全挑戰。
一個安全的Docker容器代碼沙箱環境,為AI應用提供隔離的執行空間,支持多種編程環境和文件操作。
DroidMind是一個通過AI控制Android設備的橋樑工具,實現了模型上下文協議(MCP),讓AI能通過自然語言安全地與Android設備交互。
一個基於Docker容器的安全代碼沙箱環境,為AI應用提供隔離的執行空間。
基於KùzuDB圖數據庫的分佈式內存銀行MCP實現,支持倉庫和分支隔離,提供AI驅動的內存優化、安全快照和智能分析功能
CodeSeeker是一個結合ugrep和ast-grep功能的代碼搜索與轉換工具,為AI助手提供智能搜索替換能力,支持多種搜索模式、安全替換和代碼重構。
MCP Server Semgrep是一個符合Model Context Protocol標準的服務器,集成了Semgrep靜態分析工具與AI助手,提供代碼安全分析、質量改進和漏洞檢測功能。項目簡化了架構設計,支持多平臺運行,可通過多種方式安裝,並提供了豐富的代碼分析功能。
Fastly MCP 是一個通過模型上下文協議(MCP)將Fastly API功能集成到AI助手的工具,允許用戶通過AI管理CDN服務、緩存、安全配置等,同時保護API密鑰安全。
PI API MCP服務器是一個為Claude等AI助手提供標準化工具和資源的服務,用於安全訪問和管理PI Dashboard資源。
一個為Bear筆記應用設計的只讀MCP服務器,允許AI助手如Claude安全訪問用戶筆記內容,通過直接連接SQLite數據庫實現,不修改原始數據。
Steampipe MCP服務器是一個連接AI助手與雲基礎設施數據的橋樑,支持通過自然語言查詢和分析AWS、Azure、GCP等100多種雲服務,提供安全合規分析、成本優化和查詢開發輔助功能。