OpenAI表示將遵守特朗普簽署的人工智能模型發佈前審查行政命令。公司全球事務負責人喬治·奧斯本在倫敦SXSW活動上確認,將簽署這項自願性命令並參與評估。他強調OpenAI對自身責任“非常嚴肅”,並指出作爲掌握強大技術的公司,需謹慎行事。
在2026騰訊雲AI產業應用大會上,騰訊雲發佈了代碼安全產品CodeBuddy Security,融合AI深度審計引擎與靜態分析工具Xcheck,應對AI時代漏洞激增及傳統代碼審計瓶頸。儘管AI在漏洞挖掘領域取得突破,如某大模型公司發現隱藏27年的漏洞,但利用AI挖漏洞仍面臨多重挑戰。
美國衆議院兩黨議員聯合發佈《偉大美國人工智能法案》草案,長達269頁,旨在建立聯邦框架,涵蓋前沿AI安全審計、員工舉報保護及就業影響研究。草案由兩黨議員牽頭,目前處於徵求意見階段,尚未正式提交表決。
人工智能初創公司Anthropic與美國國家安全局合作,部署Claude Mythos大模型用於進攻性網絡作戰,並派駐六名工程師提供駐場支持,進行模型定製與調優。該模型因高安全風險引發技術爭議。
createyourmusic ai因安全機制被阻攔訪問,未明確其詳細介紹
專為心理健康打造的AI,提供安全私密空間,助你處理情緒、建立習慣。
免費人臉搜索引擎,以圖搜人,掃描全網,驗證身份,保護照片安全
aifreeforever網站進行安全驗證,使用安全服務防護惡意自動程序。
Anthropic
$7
輸入tokens/百萬
$35
輸出tokens/百萬
200
上下文長度
$105
$525
Baichuan
$8
32
Tencent
$100
-
nightmedia
這是一個實驗性的量化大語言模型,採用Deckard(qx)量化方法,嵌入層為3位量化。該模型通過範數保持雙投影消除(NPBA)技術重構,不僅移除了安全限制機制,還增強了模型的認知深度和推理能力。
dogeater1612
這是一個基於Google Gemma 2 9B模型微調的荷蘭語患者模擬模型,專門為醫療教育場景設計。模型始終以固定的JSON結構響應,模擬一位剛做完手術正在康復的患者'瑪麗亞',支持護理專業學生在安全環境中鍛鍊溝通和臨床推理能力。
ErenAta00
賽博智腦是一個專門針對奪旗賽(CTF)挑戰和網絡安全任務進行微調的大語言模型。它基於Llama-3.1-8B-Instruct架構,能夠協助解決CTF問題、分析安全漏洞、進行逆向工程和密碼學挑戰,並在遵循道德準則的前提下提供漏洞利用推理。
DevQuasar
這是NVIDIA基於Qwen3架構開發的32B參數獎勵模型,專門用於強化學習中的獎勵評分和原則對齊,幫助訓練更安全、更符合人類價值觀的AI系統。
Mungert
gpt-oss-safeguard-20b是基於GPT-OSS-20b微調的安全推理模型,專門用於大語言模型輸入輸出過濾、在線內容標註以及信任與安全用例的離線標註。該模型採用Apache 2.0許可證,支持自定義策略和透明決策過程。
alenphilip
這是一款專門用於Python代碼審查的AI模型,基於Qwen2.5-7B-Instruct微調,能夠識別安全漏洞、性能問題並提供代碼質量改進建議。
unsloth
gpt-oss-safeguard-120b 是 OpenAI 基於 gpt-oss 構建的安全推理模型,擁有 1170 億參數(其中 51 億為活躍參數)。該模型專門針對安全用例設計,能夠根據提供的安全策略對文本內容進行分類和執行基礎安全任務。
GPT-OSS-Safeguard-20B是基於GPT-OSS構建的210億參數安全推理模型,專門針對安全相關的文本內容分類和過濾任務進行優化。該模型支持自定義安全策略,提供透明的推理過程,適用於大語言模型輸入輸出過濾、在線內容標註等安全用例。
LeviDeHaan
SecInt是一個針對即時nginx安全日誌分類進行微調的SmolLM2-360M模型,旨在自動檢測Web服務器日誌中的安全威脅、錯誤和正常流量模式,準確率超過99%,可在CPU上實現即時檢測。
codechrl
bert-micro-cybersecurity 是一款緊湊的變壓器模型,專為網絡安全文本分類任務而設計,可用於威脅檢測、事件報告分析等,支持英文和印尼文。
prithivMLmods
GA Guard系列是開源權重的審核模型,旨在幫助開發者和組織維護語言模型的安全性、合規性以及與現實世界的一致性。該模型可檢測七種違規類別,包括非法活動、仇恨與辱罵、個人身份信息與知識產權、提示安全、色情內容、虛假信息以及暴力與自殘。
Qwen3-4B-SafeRL是Qwen3-4B模型的安全對齊版本,通過強化學習訓練增強模型抵禦有害或對抗性提示的魯棒性。該版本採用混合獎勵函數優化,平衡安全性、有用性和最小化不必要拒絕三個目標。
GeneralAnalysis
GA Guard Thinking是General Analysis開發的40億參數開源審核模型,專門用於檢測和防止語言模型生成不安全、不合規的內容。該模型在七個安全類別上進行訓練,能夠有效識別非法活動、仇恨言論、個人信息洩露等風險內容。
ibm-granite
Granite 4.0 H-Small (FP8) 是IBM開發的Granite系列語言模型的小型FP8量化版本,專為提供專業、準確和安全的回覆而設計。該模型採用FP8精度格式,在保持性能的同時優化了推理效率。
Qwen
Qwen3-4B-SafeRL是基於Qwen3-4B模型的安全對齊版本,通過強化學習訓練並結合Qwen3Guard-Gen的獎勵信號,增強了模型對有害或對抗性提示的魯棒性,在保證安全性的同時避免產生過於簡單或迴避性的拒絕行為。
neuphonic
NeuTTS Air是世界上首個具備即時語音克隆功能的超逼真、端側文本轉語音(TTS)語言模型。基於0.5B參數的大語言模型骨幹構建,能為本地設備帶來自然的語音、即時性能、內置安全性和說話人克隆功能。
openai
gpt-oss-safeguard-20b是基於gpt-oss構建的安全推理模型,擁有210億參數(其中36億為活躍參數),專門針對安全用例設計。該模型可根據提供的安全策略對文本內容進行分類,並執行基礎安全任務,適用於大語言模型輸入輸出過濾、在線內容標註等場景。
gpt-oss-safeguard-120b是基於gpt-oss構建的安全推理模型,專門為安全用例設計。該模型能夠根據提供的安全策略對文本內容進行分類,並執行一系列基礎安全任務,適用於大語言模型輸入輸出過濾、在線內容標註等場景。
GA Guard Lite是General Analysis開發的輕量級開源審核模型,專門用於檢測語言模型輸出中的違規內容。該模型能夠識別七類安全風險,包括非法活動、仇恨言論、個人信息洩露等,為AI應用提供高效的內容安全防護。
GA Guard Core是General Analysis開發的開源審核模型,專門用於檢測和分類七類違規內容,包括非法活動、仇恨言論、個人信息洩露等,確保AI應用的安全性和合規性。
MCP-Framework是一個基於TypeScript的框架,用於優雅地構建模型上下文協議(MCP)服務器。它提供開箱即用的架構,支持自動目錄發現工具、資源和提示,具有多種傳輸方式和類型安全特性。
Aderyn是一個開源的Solidity智能合約靜態分析工具,由Rust編寫,幫助開發者和安全研究人員發現Solidity代碼中的漏洞。它支持Foundry和Hardhat項目,可生成多種格式報告,並提供VSCode擴展。
Supabase MCP服務器是一個開源工具,允許IDE安全執行SQL、管理模式變更、調用Supabase管理API和使用Auth Admin SDK,內置安全控制。
Repomix是一個將代碼庫打包為AI友好格式的工具,支持本地和遠程倉庫處理,提供代碼壓縮、安全檢查和多種輸出格式。
Agentic Radar是一個用於分析和評估代理系統的安全掃描工具,幫助開發者、研究人員和安全專家理解代理系統的工作流程並識別潛在漏洞。
Runno是一個JavaScript工具包集合,用於在瀏覽器和Node.js等環境中安全地運行多種編程語言的代碼,通過WebAssembly和WASI實現沙盒化執行,支持Python、Ruby、JavaScript、SQLite、C/C++等語言,並提供Web組件、MCP服務器等集成方式。
mcp-golang是一個非官方的Go語言實現的Model Context Protocol庫,支持快速構建MCP服務器和客戶端,提供類型安全、低代碼量、模塊化和雙向通信等特性。
MCP-Scan是一款針對MCP服務器的安全掃描工具,用於檢測提示注入、工具汙染和跨域升級等常見安全漏洞。
Exa MCP Server是一個為AI助手(如Claude)提供網絡搜索功能的服務器,通過Exa AI搜索API實現實時、安全的網絡信息獲取。
MCP-Shield是一款用於掃描MCP服務器漏洞的安全工具,可檢測工具投毒攻擊、數據洩露通道和跨域違規等安全風險。
這是一個關於Web3 Model Context Protocol (MCP) 服務器的精選列表,涵蓋了鏈交互、交易、DeFi、市場數據、工具和社交等多個類別。MCP是一個開放協議,標準化了應用程序如何向LLM提供上下文,類似於AI應用程序的USB-C端口。DeMCP是第一個去中心化的MCP網絡,專注於為代理提供自研和開源的MCP服務,支持加密支付,並結合TEE和區塊鏈註冊表重新定義了MCP的安全性和可靠性。
MCP MongoDB服務器是一個模型上下文協議服務,允許LLM與MongoDB數據庫交互,提供集合模式檢查、查詢執行和智能ID處理等功能,支持只讀模式和安全配置。
Security Detections MCP 是一個基於Model Context Protocol的服務器,允許LLM查詢統一的安全檢測規則數據庫,涵蓋Sigma、Splunk ESCU、Elastic和KQL格式。最新3.0版本升級為自主檢測工程平臺,可自動從威脅情報中提取TTPs、分析覆蓋差距、生成SIEM原生格式檢測規則、運行測試並驗證。項目包含71+工具、11個預構建工作流提示和知識圖譜系統,支持多SIEM平臺。
Nexus是一個AI工具聚合網關,支持連接多個MCP服務器和LLM提供商,通過統一端點提供工具搜索、執行和模型路由功能,支持安全認證和速率限制。
Awesome MCP Servers 是一個全面的Model Context Protocol (MCP)服務器集合,涵蓋了7158個MCP服務器,分為33個類別,包括AI集成、藝術媒體、瀏覽器自動化、雲服務、數據庫、開發者工具、文件系統、金融、遊戲、硬件、醫療、基礎設施、知識管理、位置地圖、市場營銷、監控、多媒體處理、操作系統、項目管理、科學研究、安全、社交媒體、旅行交通、實用工具和版本控制等。
這是一個實現MCP代碼執行模式的服務器,通過單工具橋接和零上下文發現機制,將MCP工具調用開銷從數萬token降至約200token,並在根容器中安全執行Python代碼,支持數據科學和安全隔離。
BloodHound-MCP是將Model Context Protocol(MCP)服務器與BloodHound集成的項目,通過自然語言分析Active Directory安全數據。
JADX是一款功能強大的Android Dex和Apk文件反編譯工具,支持將Dalvik字節碼轉換為Java源代碼,並能解碼資源文件和進行代碼混淆還原。提供命令行和圖形界面兩種操作方式,適用於開發者和安全研究人員。
AWS MCP是一個通過自然語言查詢和管理AWS資源的AI助手服務,支持多賬戶、多區域和安全憑證管理。
BloodHound-MCP是將模型上下文協議(MCP)服務器與BloodHound集成的工具,通過自然語言分析Active Directory攻擊路徑,提供75+專用工具進行AD安全評估。