Mozilla發佈火狐瀏覽器150穩定版,通過與Anthropic公司合作,利用其Mythos Preview AI模型成功檢測並修復了271個安全漏洞。這是繼148版本首次使用Opus 4.6模型發現22個漏洞後的又一次合作。Mozilla首席技術官表示,傳統依賴模糊測試和人工分析的方法難以全面覆蓋漏洞,AI技術的引入顯著提升了安全檢測效率。
OpenAI CEO奧爾特曼公開質疑競爭對手Anthropic,稱其利用公衆對AI的恐懼心理誇大產品能力,實爲商業策略。爭議焦點在於Anthropic的安全模型被指限制精英使用,涉嫌製造技術壁壘。
新加坡金融管理局敦促當地銀行加強網絡安全,以應對AI模型Mythos可能帶來的風險。該機構正與網絡安全部門合作,提升關鍵基礎設施的防護能力。
Nature最新研究揭示,大型語言模型存在“潛意識學習”現象,即使訓練數據經過嚴格過濾,不良行爲特徵仍能通過數字序列、代碼等看似無害的形式傳遞給下游模型。這暴露了“模型蒸餾”技術可能放大上游模型的隱性風險,AI安全面臨新挑戰。
由Kilo託管的AI,一鍵部署OpenClaw,有500+模型,企業級安全
提供高質量 AI 接口服務,支持多種 AI 模型,安全穩定。
AgentSphere是一個AI本地雲基礎設施,用於安全的LLM代碼執行。
F Lite 是一款 10B 參數的擴散模型,專注於合法和安全內容。
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$2
$20
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
nightmedia
這是一個實驗性的量化大語言模型,採用Deckard(qx)量化方法,嵌入層為3位量化。該模型通過範數保持雙投影消除(NPBA)技術重構,不僅移除了安全限制機制,還增強了模型的認知深度和推理能力。
dogeater1612
這是一個基於Google Gemma 2 9B模型微調的荷蘭語患者模擬模型,專門為醫療教育場景設計。模型始終以固定的JSON結構響應,模擬一位剛做完手術正在康復的患者'瑪麗亞',支持護理專業學生在安全環境中鍛鍊溝通和臨床推理能力。
ErenAta00
賽博智腦是一個專門針對奪旗賽(CTF)挑戰和網絡安全任務進行微調的大語言模型。它基於Llama-3.1-8B-Instruct架構,能夠協助解決CTF問題、分析安全漏洞、進行逆向工程和密碼學挑戰,並在遵循道德準則的前提下提供漏洞利用推理。
DevQuasar
這是NVIDIA基於Qwen3架構開發的32B參數獎勵模型,專門用於強化學習中的獎勵評分和原則對齊,幫助訓練更安全、更符合人類價值觀的AI系統。
Mungert
gpt-oss-safeguard-20b是基於GPT-OSS-20b微調的安全推理模型,專門用於大語言模型輸入輸出過濾、在線內容標註以及信任與安全用例的離線標註。該模型採用Apache 2.0許可證,支持自定義策略和透明決策過程。
alenphilip
這是一款專門用於Python代碼審查的AI模型,基於Qwen2.5-7B-Instruct微調,能夠識別安全漏洞、性能問題並提供代碼質量改進建議。
unsloth
gpt-oss-safeguard-120b 是 OpenAI 基於 gpt-oss 構建的安全推理模型,擁有 1170 億參數(其中 51 億為活躍參數)。該模型專門針對安全用例設計,能夠根據提供的安全策略對文本內容進行分類和執行基礎安全任務。
GPT-OSS-Safeguard-20B是基於GPT-OSS構建的210億參數安全推理模型,專門針對安全相關的文本內容分類和過濾任務進行優化。該模型支持自定義安全策略,提供透明的推理過程,適用於大語言模型輸入輸出過濾、在線內容標註等安全用例。
LeviDeHaan
SecInt是一個針對即時nginx安全日誌分類進行微調的SmolLM2-360M模型,旨在自動檢測Web服務器日誌中的安全威脅、錯誤和正常流量模式,準確率超過99%,可在CPU上實現即時檢測。
codechrl
bert-micro-cybersecurity 是一款緊湊的變壓器模型,專為網絡安全文本分類任務而設計,可用於威脅檢測、事件報告分析等,支持英文和印尼文。
prithivMLmods
GA Guard系列是開源權重的審核模型,旨在幫助開發者和組織維護語言模型的安全性、合規性以及與現實世界的一致性。該模型可檢測七種違規類別,包括非法活動、仇恨與辱罵、個人身份信息與知識產權、提示安全、色情內容、虛假信息以及暴力與自殘。
Qwen3-4B-SafeRL是Qwen3-4B模型的安全對齊版本,通過強化學習訓練增強模型抵禦有害或對抗性提示的魯棒性。該版本採用混合獎勵函數優化,平衡安全性、有用性和最小化不必要拒絕三個目標。
GeneralAnalysis
GA Guard Thinking是General Analysis開發的40億參數開源審核模型,專門用於檢測和防止語言模型生成不安全、不合規的內容。該模型在七個安全類別上進行訓練,能夠有效識別非法活動、仇恨言論、個人信息洩露等風險內容。
ibm-granite
Granite 4.0 H-Small (FP8) 是IBM開發的Granite系列語言模型的小型FP8量化版本,專為提供專業、準確和安全的回覆而設計。該模型採用FP8精度格式,在保持性能的同時優化了推理效率。
Qwen
Qwen3-4B-SafeRL是基於Qwen3-4B模型的安全對齊版本,通過強化學習訓練並結合Qwen3Guard-Gen的獎勵信號,增強了模型對有害或對抗性提示的魯棒性,在保證安全性的同時避免產生過於簡單或迴避性的拒絕行為。
neuphonic
NeuTTS Air是世界上首個具備即時語音克隆功能的超逼真、端側文本轉語音(TTS)語言模型。基於0.5B參數的大語言模型骨幹構建,能為本地設備帶來自然的語音、即時性能、內置安全性和說話人克隆功能。
openai
gpt-oss-safeguard-20b是基於gpt-oss構建的安全推理模型,擁有210億參數(其中36億為活躍參數),專門針對安全用例設計。該模型可根據提供的安全策略對文本內容進行分類,並執行基礎安全任務,適用於大語言模型輸入輸出過濾、在線內容標註等場景。
gpt-oss-safeguard-120b是基於gpt-oss構建的安全推理模型,專門為安全用例設計。該模型能夠根據提供的安全策略對文本內容進行分類,並執行一系列基礎安全任務,適用於大語言模型輸入輸出過濾、在線內容標註等場景。
GA Guard Lite是General Analysis開發的輕量級開源審核模型,專門用於檢測語言模型輸出中的違規內容。該模型能夠識別七類安全風險,包括非法活動、仇恨言論、個人信息洩露等,為AI應用提供高效的內容安全防護。
GA Guard Core是General Analysis開發的開源審核模型,專門用於檢測和分類七類違規內容,包括非法活動、仇恨言論、個人信息洩露等,確保AI應用的安全性和合規性。
MCP-Framework是一個基於TypeScript的框架,用於優雅地構建模型上下文協議(MCP)服務器。它提供開箱即用的架構,支持自動目錄發現工具、資源和提示,具有多種傳輸方式和類型安全特性。
MCP MongoDB服務器是一個模型上下文協議服務,允許LLM與MongoDB數據庫交互,提供集合模式檢查、查詢執行和智能ID處理等功能,支持只讀模式和安全配置。
Nexus是一個AI工具聚合網關,支持連接多個MCP服務器和LLM提供商,通過統一端點提供工具搜索、執行和模型路由功能,支持安全認證和速率限制。
BloodHound-MCP是將模型上下文協議(MCP)服務器與BloodHound集成的工具,通過自然語言分析Active Directory攻擊路徑,提供75+專用工具進行AD安全評估。
該項目通過MCP協議實現了類似Claude Code的功能,提供代碼理解、修改、命令執行等工具,支持多模型和Jupyter筆記本操作,具備安全控制和開發擴展能力。
Awesome MCP Security 是一個關於模型上下文協議(MCP)安全的資源集合,包括安全考慮、論文、視頻、文章、工具和服務器等內容,旨在幫助用戶瞭解和應對MCP相關的安全挑戰。
DroidMind是一個通過AI控制Android設備的橋樑工具,實現了模型上下文協議(MCP),讓AI能通過自然語言安全地與Android設備交互。
CLEO是一個為AI軟件開發設計的便攜式大腦與記憶系統,提供跨倉庫、模型供應商和編碼工具的項目記憶、可驗證來源和代理安全編排。
Remote-MCP是一個類型安全、雙向且簡單的遠程MCP通信解決方案,支持遠程訪問和集中管理模型上下文。
Webvizio MCP服務器是一個基於TypeScript的模型上下文協議服務器,提供對Webvizio API的安全結構化訪問,可將網站反饋和錯誤報告自動轉換為可執行的開發任務,供AI編碼代理處理。
MCP NMAP服務器是一個為AI助手提供網絡掃描功能的協議服務器,通過標準化接口讓AI模型能夠使用NMAP進行網絡分析和安全評估。
Fastly MCP 是一個通過模型上下文協議(MCP)將Fastly API功能集成到AI助手的工具,允許用戶通過AI管理CDN服務、緩存、安全配置等,同時保護API密鑰安全。
Daytona MCP解釋器是一個實現模型上下文協議(MCP)標準的服務器,為AI助手提供在安全的隔離環境中執行Python代碼和Shell命令的能力。
一個基於安全優先模型的Ubuntu MCP服務器,為AI助手提供受控的系統操作訪問,包含多層安全防護、審計日誌和資源限制。
Insights Knowledge Base (IKB) MCP Server 是一個即插即用的免費知識庫,內置10,000+高質量洞察報告,支持本地安全存儲和私有文檔解析。項目優化了數據處理效率,提供每週報告更新,並計劃未來集成嵌入模型和增強報告系統。
MCP-ANY-REST是一個基於Model Context Protocol標準的REST API連接器,通過ZML配置語言實現AI模型與業務系統的安全高效對接,支持服務編排和令牌認證。
pgEdge Postgres MCP服務器是一個基於模型上下文協議(MCP)的工具,允許通過自然語言對PostgreSQL數據庫進行SQL查詢。它提供只讀保護、多種客戶端支持(包括Web界面和CLI)、安全認證和Docker部署等功能,適用於內部開發和可信環境。
Lighthouse MCP Server是一個基於Google Lighthouse的模型上下文協議服務器,提供全面的網站性能審計和分析功能,包括性能評分、可訪問性檢查、SEO分析和安全評估。
這是一個關於Awesome Model Context Protocol (MCP) Servers的精選列表,包含了各種MCP服務器、框架、工具和資源的詳細分類和描述。MCP是一個開放協議,使AI模型能夠通過標準化的服務器實現安全地與本地和遠程資源交互。列表涵蓋了從瀏覽器自動化、雲平臺、數據庫、開發者工具到金融科技、遊戲、安全等多個領域的MCP服務器實現。
HydraMCP是一個輕量級、可擴展的網絡安全工具包,通過模型上下文協議(MCP)將AI助手與安全工具連接,支持AI輔助的安全研究、掃描和分析。