谷歌發佈Magika 1.0 AI文件檢測系統,核心引擎改用Rust語言,顯著提升處理速度和內存安全性。自去年開源後月下載超百萬次,新版經架構重構,在性能與安全方面實現重大突破。
谷歌發佈AI文件類型檢測工具Magika 1.0穩定版,通過優化的深度學習模型提升檢測速度、安全性和準確性,解決傳統方法誤判問題。該開源工具已整合至Gmail等谷歌產品中。
英國與多所頂尖大學專家研究發現,440多個AI模型安全評估基準幾乎都存在缺陷,可能削弱結果有效性,甚至產生誤導性評分,影響AI安全評估的可靠性。
螞蟻數科與寧波銀行聯合打造的“Agentar知識工程KBase”方案入選2025金融街論壇國際標準金融應用卓越案例。該方案以高安全性、準確度和可解釋性解決金融機構“知識孤島”問題,爲行業智能化升級提供標杆示範。
快速構建具有人工智能的網站
從想法到現實應用只需幾分鐘,Base44為您提供啟動完全功能的應用所需的工具 - 無需代碼,無需設置,無需麻煩。
上傳您的代碼,找出所有問題,一鍵修復。
AgentSphere是一個AI本地雲基礎設施,用於安全的LLM代碼執行。
anthropic
-
輸入tokens/百萬
輸出tokens/百萬
200k
上下文長度
azure
$0.5
$1.01
16k
openai
$1.08
$4.32
128k
$0.36
$0.72
100k
meta
4.1k
prithivMLmods
GA Guard系列是開源權重的審核模型,旨在幫助開發者和組織維護語言模型的安全性、合規性以及與現實世界的一致性。該模型可檢測七種違規類別,包括非法活動、仇恨與辱罵、個人身份信息與知識產權、提示安全、色情內容、虛假信息以及暴力與自殘。
Qwen3-4B-SafeRL是Qwen3-4B模型的安全對齊版本,通過強化學習訓練增強模型抵禦有害或對抗性提示的魯棒性。該版本採用混合獎勵函數優化,平衡安全性、有用性和最小化不必要拒絕三個目標。
Qwen
Qwen3-4B-SafeRL是基於Qwen3-4B模型的安全對齊版本,通過強化學習訓練並結合Qwen3Guard-Gen的獎勵信號,增強了模型對有害或對抗性提示的魯棒性,在保證安全性的同時避免產生過於簡單或迴避性的拒絕行為。
neuphonic
NeuTTS Air是世界上首個具備即時語音克隆功能的超逼真、端側文本轉語音(TTS)語言模型。基於0.5B參數的大語言模型骨幹構建,能為本地設備帶來自然的語音、即時性能、內置安全性和說話人克隆功能。
GeneralAnalysis
GA Guard Core是General Analysis開發的開源審核模型,專門用於檢測和分類七類違規內容,包括非法活動、仇恨言論、個人信息洩露等,確保AI應用的安全性和合規性。
mradermacher
這是對FBogaerts/NextCoder-7B-Finetuned模型進行量化處理後的版本,提供多種量化版本,適用於文本生成、代碼生成等任務,特別關注安全性和漏洞注入檢測。
danielkty22
TARS-SFT-7B是一個基於監督微調的安全推理模型,作為強化學習訓練的基礎模型,專門設計用於增強AI系統的安全性。該模型從Qwen2.5-7B-Instruct開始訓練,通過推理過程作為自適應防禦機制來提升模型的安全性能。
Roblox
RoGuard 1.0 是一款基於Llama-3.1-8B-Instruct微調的大語言模型,專注於提升文本生成API的安全性。
HugoHE
M-Hood 是一系列專門設計用於緩解目標檢測中幻覺現象的模型,通過新穎的微調策略和修正的基準數據集,顯著減少分佈外數據上的誤報,提升目標檢測系統的安全性和可靠性。
DMindAI
DMind-1是基於Qwen3-32B打造的Web3專家模型,通過監督式指令微調與人類反饋強化學習專為Web3生態系統優化,在任務準確性、內容安全性和專家級交互對齊方面實現顯著提升。
AIML-TUDA
QwenGuard-v1.2-3B是基於Qwen/Qwen2.5-VL-3B-Instruct開發的視覺安全防護模型,用於評估圖像內容的安全性。
ibm-granite
Granite-speech-3.3-2b是IBM開發的緊湊高效語音語言模型,專為自動語音識別(ASR)和自動語音翻譯(AST)設計,採用雙通設計提高模塊化和安全性。
Beaver-7B-v3.0 是一個基於 LLaMA 架構的 7B 參數大語言模型,專注於安全性和人類反饋強化學習(RLHF)。
TheBlueScrubs
基於ModernBERT架構的醫療文本安全與倫理分類器,專為評估醫療領域文本安全性而設計
lunahr
Phi-4-mini-instruct是基於合成數據和精選公開網站構建的輕量級開源模型,專注於高質量、強推理能力的數據。支持128K令牌上下文長度,通過監督微調和直接偏好優化進行增強,以確保精準的指令遵循和安全性。
Foreshhh
Qwen2-VL-7B-Instruct 是一個基於 SafeRLHF 數據集微調的多模態大語言模型,專注於視覺問答任務,並強調安全性。
testsavantai
TestSavantAI模型是一組專為防禦大型語言模型(LLM)提示注入和越獄攻擊而設計的分類器,微型版基於BERT-tiny架構,平衡安全性與計算效率。
SeaLLMs
SeaLLMs-v3是面向東南亞語言的大語言模型系列的最新版本,在同類規模模型中取得最先進的性能,在世界知識、數學推理、翻譯和指令遵循等任務中表現出色,特別優化了可靠性和安全性,減少幻覺現象。
thesven
Meta Llama3 Instruct 8B是Meta發佈的8B參數指令調優大語言模型,針對對話場景優化,在安全性和幫助性方面表現優異。
mlabonne
Meta Llama 3是Meta開發的大語言模型系列,包含80億和700億參數的預訓練及指令微調版本。該模型針對對話場景優化,在行業基準測試中表現優異,注重實用性和安全性。
這是一個關於Web3 Model Context Protocol (MCP) 服務器的精選列表,涵蓋了鏈交互、交易、DeFi、市場數據、工具和社交等多個類別。MCP是一個開放協議,標準化了應用程序如何向LLM提供上下文,類似於AI應用程序的USB-C端口。DeMCP是第一個去中心化的MCP網絡,專注於為代理提供自研和開源的MCP服務,支持加密支付,並結合TEE和區塊鏈註冊表重新定義了MCP的安全性和可靠性。
ToolHive是一個輕量級工具,旨在簡化MCP服務器的部署和管理,提供易用性、一致性和安全性。
基於Deno和TypeScript實現的Meson跨鏈交易MCP服務器,提供資產在不同區塊鏈間便捷轉移的服務,支持主網和測試網環境,通過環境變量配置私鑰確保安全性。
Kubernetes MCP服務器是一個提供安全只讀訪問Kubernetes資源的工具,用於調試和檢查集群狀態。支持多集群切換、CRD資源和智能資源發現,強調安全性和高性能。
MCP命令執行服務器是一個基於MCP協議的安全系統命令執行工具,通過白名單機制確保命令執行的安全性。
一個專注於安全性的MCP服務器實現集合,提供企業級安全加固,支持多種安全平臺集成,包括Splunk、CrowdStrike和MISP,具備全面的安全防護措施。
一個全面的Stacks區塊鏈MCP服務器,提供30多個專業工具用於Clarity智能合約開發、SIP標準合規、安全性和性能優化,支持完整的dApp開發流程。
該項目包含用於測試Coroot MCP服務器集成的自定義斜槓命令,提供兩種測試方式:直接調用工具測試和自然語言測試,確保安全性和非破壞性。
AIM Guard MCP是一個AI安全防護服務器,為AI代理提供安全分析、內容審查和防護指令,確保AI與各類MCP服務交互時的安全性。
BoostSecurity MCP是一個用於保護AI代理開發工作流程的安全工具,通過驗證第三方軟件包的安全性來防止供應鏈攻擊,支持多種編程語言和包生態系統。
Authenticator App MCP Server是一個安全的MCP(模型上下文協議)服務器,使AI代理能夠與Authenticator App交互,無縫獲取2FA代碼和密碼,幫助自動化登錄流程,同時保持安全性。
AWS MCP是一個通過自然語言管理AWS資源的AI工具,替代Amazon Q,提供更高靈活性和安全性。
SecureAnnex MCP服務器是一個用於分析瀏覽器擴展安全性的工具,提供查詢、分析和評估擴展安全性的功能,包括漏洞檢測、簽名檢查、代碼審查等。
MSSQL MCP Server是一個安全的MCP協議服務器,用於與Microsoft SQL Server數據庫進行結構化交互,支持表查詢、數據讀取和受控SQL執行,確保數據庫操作的安全性和可審計性。
GUARDRAIL是一個專為大型語言模型(LLM)應用生態系統設計的安全框架,特別針對模型上下文協議(MCP)提供全面保護。它採用多層架構,包括信息網關層、上下文驗證層、請求控制層、執行隔離層和審計監控層,旨在防止數據洩露、未授權訪問和資源濫用。該框架強調漸進式採用,允許開發者逐步增強安全性,同時保持高性能和易用性。
Shield MCP是一個為Model Context Protocol (MCP)服務器設計的安全中間件,提供工具訪問控制、結果淨化、結構化日誌記錄和速率限制等功能,無需修改官方SDK即可增強安全性和監控能力。
HooksMCP是一個通過YAML配置文件為編碼代理提供MCP訪問權限的工具,支持代碼檢查、測試、格式化等功能,簡化開發流程並提升安全性。
uMCP是一個專為Unity設計的MCP協議服務器實現,用於連接AI代理與Unity應用,具有安全性和可擴展性。
一個用於檢查和撤銷ERC-20代幣授權的MCP服務器,增強安全性和控制力。
ServeMyAPI是一個基於macOS Keychain的安全API密鑰管理工具,通過MCP協議提供跨項目的密鑰存儲和訪問服務,解決了傳統.env文件的安全性和協作問題。