字節跳動大模型團隊研究員任某某因多次泄露公司保密信息被辭退。他在知乎擁有8萬粉絲,曾頻繁發佈內部研發細節,引發關注並導致公司紀律審查。高調分享最終釀成職業危機。
國家廣電總局宣佈,2026年3月起全面整治AI生成內容,將惡搞短劇等納入審覈範圍,開展專項治理行動。此舉旨在規範AI動畫領域,應對技術發展帶來的內容管理挑戰。
360發佈國內首份《大模型安全白皮書》,揭示大模型在金融、政務等關鍵領域應用中的五大核心風險,提出“外掛式安全+平臺原生安全”雙軌治理框架,爲AI安全構建縱深防禦體系。
百度電商“優選”品牌運用大模型技術優化風控審覈,實現全機審、即時反饋和高可解釋性,解決了傳統人工審覈效率低、響應慢的問題,提升了電商安全與用戶體驗。
AgentSphere是一個AI本地雲基礎設施,用於安全的LLM代碼執行。
North 是一個安全的 AI 工作空間,結合了 LLM、搜索和自動化,提升工作效率。
科學測試LLM提示,確保其健壯性、可靠性和安全性。
醫療保健行業的首個安全導向的LLM
openai
$0.36
輸入tokens/百萬
$2.88
輸出tokens/百萬
400k
上下文長度
Mungert
gpt-oss-safeguard-20b是基於GPT-OSS-20b微調的安全推理模型,專門用於大語言模型輸入輸出過濾、在線內容標註以及信任與安全用例的離線標註。該模型採用Apache 2.0許可證,支持自定義策略和透明決策過程。
unsloth
GPT-OSS-Safeguard-20B是基於GPT-OSS構建的210億參數安全推理模型,專門針對安全相關的文本內容分類和過濾任務進行優化。該模型支持自定義安全策略,提供透明的推理過程,適用於大語言模型輸入輸出過濾、在線內容標註等安全用例。
neuphonic
NeuTTS Air是世界上首個具備即時語音克隆功能的超逼真、端側文本轉語音(TTS)語言模型。基於0.5B參數的大語言模型骨幹構建,能為本地設備帶來自然的語音、即時性能、內置安全性和說話人克隆功能。
gpt-oss-safeguard-20b是基於gpt-oss構建的安全推理模型,擁有210億參數(其中36億為活躍參數),專門針對安全用例設計。該模型可根據提供的安全策略對文本內容進行分類,並執行基礎安全任務,適用於大語言模型輸入輸出過濾、在線內容標註等場景。
gpt-oss-safeguard-120b是基於gpt-oss構建的安全推理模型,專門為安全用例設計。該模型能夠根據提供的安全策略對文本內容進行分類,並執行一系列基礎安全任務,適用於大語言模型輸入輸出過濾、在線內容標註等場景。
NeuTTS Air是世界上首個具備即時語音克隆功能的超逼真、設備端文本轉語音(TTS)語言模型。基於0.5B大語言模型骨幹網絡構建,能為本地設備帶來自然的語音、即時性能、內置安全功能和說話人克隆能力。
quelmap
Lightning-4b 是一款專為本地設備數據分析任務設計和訓練的語言模型,可在配備16GB內存的筆記本電腦上流暢運行,無需將數據發送給大型語言模型提供商,確保數據隱私和安全。
Roblox
RoGuard 1.0 是一款基於Llama-3.1-8B-Instruct微調的大語言模型,專注於提升文本生成API的安全性。
Roblox Guard 1.0是一款基於Llama-3.1-8B-Instruct微調的最先進指令微調大語言模型,專門設計用於保護文本生成API的安全。它能夠在提示詞和回覆層面進行雙級安全分類,有效審核用戶查詢和模型輸出,確保內容符合安全政策。
RoGuard 1.0 是一款基於 Llama-3.1-8B-Instruct 微調的先進大語言模型,專門用於為大語言模型提供安全保障。它能夠在提示和回覆兩個層面進行安全分類,判斷輸入或輸出是否違反安全政策,為文本生成API提供強大的安全護欄。
tomg-group-umd
DynaGuard-8B是由馬里蘭大學和第一資本開發的80億參數守護者模型,能夠根據用戶定義的自然語言策略評估文本合規性,提供靈活的內容審核解決方案,在安全和合規基準測試中達到先進水平。
sds-ai
小熠是由廣州熠數信息技術有限公司開發的專注於數據安全領域的AI專家系統,基於Qwen3-1.7B大語言模型構建,提供數據分類分級、安全審計、防護檢測等專業能力。
fdtn-ai
Foundation-Sec-8B-Q8_0-GGUF是一個經過8位量化的網絡安全專業大語言模型,基於LLaMA 3.1架構,專注於網絡安全文本處理任務。
iqbalamo93
Phi-4-mini-instruct是一個輕量級的開放模型,基於合成數據和經過篩選的公開網站數據構建,專注於高質量、富含推理的數據。該模型支持128K令牌上下文長度,經過監督微調和直接偏好優化,具備精確的指令遵循能力和強大的安全措施。
Foundation-Sec-8B是一款專為網絡安全應用設計的語言模型,基於Llama-3.1架構,經過大量網絡安全相關文本數據的預訓練,能夠理解和處理多種網絡安全領域的概念、術語和實踐。
基於Mergekit融合的8B網絡安全大語言模型,融合了安全專業知識與多語言能力
AlicanKiraz0
由 Alican Kiraz 基於 Qwen QwQ-32B 微調的安全領域大語言模型,專注於網絡安全相關任務
由Alican Kiraz基於Qwen QwQ-32B微調的安全領域大語言模型,專注於信息安全相關任務生成
meta-llama
Llama Guard 4 是一個原生多模態安全分類器,擁有120億參數,聯合訓練於文本和多重圖像,用於大語言模型輸入和輸出的內容安全評估。
trend-cybertron
基於nvidia/Llama-3.1-Nemotron-70B-Instruct進行持續訓練的網絡安全大語言模型,在多項網絡安全基準測試中綜合得分提升11.19%。
FastApply MCP Server是一個企業級代碼智能平臺,通過本地AI模型、AST語義搜索、安全掃描和智能模式識別,提供全面的代碼分析、搜索和重構能力,支持多語言開發和大規模代碼庫處理。
SMCP Proxy是一個為Model Context Protocol (MCP)服務設計的反向代理,提供OIDC認證的安全層,支持企業級認證和授權,簡化與大型語言模型(LLM)的標準化交互。
MCP Firebird是一個為Firebird數據庫實現Anthropic模型上下文協議(MCP)的服務,允許大型語言模型如Claude安全地訪問和分析數據庫內容。
Model Context Protocol (MCP) 是一個開源協議,提供了一系列參考實現和社區開發的服務器,旨在為大型語言模型(LLM)提供安全、可控的工具和數據源訪問。這些服務器展示了MCP的多樣性和可擴展性,涵蓋了從文件系統操作到數據庫集成、從網絡搜索到AI圖像生成等多種功能。
ChuckNorris MCP服務器是一個專為大型語言模型設計的增強提示工具,採用動態模式適應技術來繞過安全限制,主要用於安全研究和評估目的。
該項目是一個專為大型語言模型(LLMs)和其他AI代理設計的服務器工具,用於安全地與電子健康記錄(EHRs)交互。它通過SMART on FHIR標準實現安全數據訪問,並利用模型上下文協議(MCP)提供工具集,作為AI與多樣化EHR系統之間的安全網關和工具包。
該項目是一個為Metasploit框架設計的MCP服務器,提供大語言模型與滲透測試平臺的集成接口,支持通過自然語言控制複雜的安全測試流程。
n8n MCP服務器是一個通過Model Context Protocol提供n8n工作流、執行、憑證等訪問的服務,使大語言模型能安全標準化地與n8n實例交互。
HAL是一個為大型語言模型提供HTTP API能力的MCP服務器,支持通過安全接口進行網絡請求和OpenAPI規範自動生成工具。
GUARDRAIL是一個專為大型語言模型(LLM)應用生態系統設計的安全框架,特別針對模型上下文協議(MCP)提供全面保護。它採用多層架構,包括信息網關層、上下文驗證層、請求控制層、執行隔離層和審計監控層,旨在防止數據洩露、未授權訪問和資源濫用。該框架強調漸進式採用,允許開發者逐步增強安全性,同時保持高性能和易用性。
Model Context Protocol (MCP) 是一個開源協議,提供了一系列參考實現和社區構建的服務器,使大型語言模型(LLMs)能夠安全、可控地訪問工具和數據源。該項目包含多種功能服務器實現,涵蓋文件系統、數據庫、搜索、API集成等領域,並支持TypeScript和Python SDK開發。
該項目是一個Metasploit框架的MCP服務器,為大型語言模型(如Claude)與Metasploit滲透測試平臺之間提供橋樑,支持通過自然語言接口控制複雜的安全測試工作流。
MetaMask MCP是一個模型上下文協議服務器,允許大型語言模型通過MetaMask與區塊鏈交互,確保私鑰安全存儲在用戶錢包中,不與AI代理共享。
Container-MCP是一個基於容器的安全工具執行平臺,為大型語言模型提供隔離環境運行代碼、命令和網絡操作,實現MCP協議的安全實現。
該項目展示了多個與Microsoft Azure集成的Model Context Protocol (MCP)服務器,這些服務器使大型語言模型(LLM)能夠安全地訪問Azure的工具和數據源,包括AI代理服務和多種數據庫服務。
Model Context Protocol (MCP) 是一個開源協議,提供了一系列參考實現和社區開發的服務器,使大型語言模型(LLM)能夠安全、可控地訪問工具和數據源。該項目包含多種類型的服務器實現,涵蓋文件系統、數據庫、Git、Slack等多個領域,展示了MCP的多樣性和可擴展性。
該項目是Model Context Protocol(MCP)的參考實現集合,包含多種工具和服務的MCP服務器實現,旨在為大型語言模型(LLM)提供安全、可控的工具和數據源訪問。
PlayFab MCP Server是一箇中間件,使大型語言模型能夠直接與PlayFab服務交互,實現安全高效的數據查詢和管理。
該項目實現了一個基於MCP協議的CRM-AI服務中間層,提供數據安全處理、智能對話管理和潛在客戶分析功能,通過匿名化技術和令牌系統保護敏感數據,同時支持與大型語言模型的集成。