谷歌发布Magika 1.0 AI文件检测系统,核心引擎改用Rust语言,显著提升处理速度和内存安全性。自去年开源后月下载超百万次,新版经架构重构,在性能与安全方面实现重大突破。
谷歌发布AI文件类型检测工具Magika 1.0稳定版,通过优化的深度学习模型提升检测速度、安全性和准确性,解决传统方法误判问题。该开源工具已整合至Gmail等谷歌产品中。
英国与多所顶尖大学专家研究发现,440多个AI模型安全评估基准几乎都存在缺陷,可能削弱结果有效性,甚至产生误导性评分,影响AI安全评估的可靠性。
蚂蚁数科与宁波银行联合打造的“Agentar知识工程KBase”方案入选2025金融街论坛国际标准金融应用卓越案例。该方案以高安全性、准确度和可解释性解决金融机构“知识孤岛”问题,为行业智能化升级提供标杆示范。
快速构建具有人工智能的网站
从想法到现实应用只需几分钟,Base44为您提供启动完全功能的应用所需的工具 - 无需代码,无需设置,无需麻烦。
上传您的代码,找出所有问题,一键修复。
AgentSphere是一个AI本地云基础设施,用于安全的LLM代码执行。
anthropic
-
Input tokens/M
Output tokens/M
200k
Context Length
azure
$0.5
$1.01
16k
openai
$1.08
$4.32
128k
$0.36
$0.72
100k
meta
4.1k
prithivMLmods
GA Guard系列是开源权重的审核模型,旨在帮助开发者和组织维护语言模型的安全性、合规性以及与现实世界的一致性。该模型可检测七种违规类别,包括非法活动、仇恨与辱骂、个人身份信息与知识产权、提示安全、色情内容、虚假信息以及暴力与自残。
Qwen3-4B-SafeRL是Qwen3-4B模型的安全对齐版本,通过强化学习训练增强模型抵御有害或对抗性提示的鲁棒性。该版本采用混合奖励函数优化,平衡安全性、有用性和最小化不必要拒绝三个目标。
Qwen
Qwen3-4B-SafeRL是基于Qwen3-4B模型的安全对齐版本,通过强化学习训练并结合Qwen3Guard-Gen的奖励信号,增强了模型对有害或对抗性提示的鲁棒性,在保证安全性的同时避免产生过于简单或回避性的拒绝行为。
neuphonic
NeuTTS Air是世界上首个具备即时语音克隆功能的超逼真、端侧文本转语音(TTS)语言模型。基于0.5B参数的大语言模型骨干构建,能为本地设备带来自然的语音、实时性能、内置安全性和说话人克隆功能。
GeneralAnalysis
GA Guard Core是General Analysis开发的开源审核模型,专门用于检测和分类七类违规内容,包括非法活动、仇恨言论、个人信息泄露等,确保AI应用的安全性和合规性。
mradermacher
这是对FBogaerts/NextCoder-7B-Finetuned模型进行量化处理后的版本,提供多种量化版本,适用于文本生成、代码生成等任务,特别关注安全性和漏洞注入检测。
danielkty22
TARS-SFT-7B是一个基于监督微调的安全推理模型,作为强化学习训练的基础模型,专门设计用于增强AI系统的安全性。该模型从Qwen2.5-7B-Instruct开始训练,通过推理过程作为自适应防御机制来提升模型的安全性能。
Roblox
RoGuard 1.0 是一款基于Llama-3.1-8B-Instruct微调的大语言模型,专注于提升文本生成API的安全性。
HugoHE
M-Hood 是一系列专门设计用于缓解目标检测中幻觉现象的模型,通过新颖的微调策略和修正的基准数据集,显著减少分布外数据上的误报,提升目标检测系统的安全性和可靠性。
DMindAI
DMind-1是基于Qwen3-32B打造的Web3专家模型,通过监督式指令微调与人类反馈强化学习专为Web3生态系统优化,在任务准确性、内容安全性和专家级交互对齐方面实现显著提升。
AIML-TUDA
QwenGuard-v1.2-3B是基于Qwen/Qwen2.5-VL-3B-Instruct开发的视觉安全防护模型,用于评估图像内容的安全性。
ibm-granite
Granite-speech-3.3-2b是IBM开发的紧凑高效语音语言模型,专为自动语音识别(ASR)和自动语音翻译(AST)设计,采用双通设计提高模块化和安全性。
Beaver-7B-v3.0 是一个基于 LLaMA 架构的 7B 参数大语言模型,专注于安全性和人类反馈强化学习(RLHF)。
TheBlueScrubs
基于ModernBERT架构的医疗文本安全与伦理分类器,专为评估医疗领域文本安全性而设计
lunahr
Phi-4-mini-instruct是基于合成数据和精选公开网站构建的轻量级开源模型,专注于高质量、强推理能力的数据。支持128K令牌上下文长度,通过监督微调和直接偏好优化进行增强,以确保精准的指令遵循和安全性。
Foreshhh
Qwen2-VL-7B-Instruct 是一个基于 SafeRLHF 数据集微调的多模态大语言模型,专注于视觉问答任务,并强调安全性。
testsavantai
TestSavantAI模型是一组专为防御大型语言模型(LLM)提示注入和越狱攻击而设计的分类器,微型版基于BERT-tiny架构,平衡安全性与计算效率。
SeaLLMs
SeaLLMs-v3是面向东南亚语言的大语言模型系列的最新版本,在同类规模模型中取得最先进的性能,在世界知识、数学推理、翻译和指令遵循等任务中表现出色,特别优化了可靠性和安全性,减少幻觉现象。
thesven
Meta Llama3 Instruct 8B是Meta发布的8B参数指令调优大语言模型,针对对话场景优化,在安全性和帮助性方面表现优异。
mlabonne
Meta Llama 3是Meta开发的大语言模型系列,包含80亿和700亿参数的预训练及指令微调版本。该模型针对对话场景优化,在行业基准测试中表现优异,注重实用性和安全性。
这是一个关于Web3 Model Context Protocol (MCP) 服务器的精选列表,涵盖了链交互、交易、DeFi、市场数据、工具和社交等多个类别。MCP是一个开放协议,标准化了应用程序如何向LLM提供上下文,类似于AI应用程序的USB-C端口。DeMCP是第一个去中心化的MCP网络,专注于为代理提供自研和开源的MCP服务,支持加密支付,并结合TEE和区块链注册表重新定义了MCP的安全性和可靠性。
ToolHive是一个轻量级工具,旨在简化MCP服务器的部署和管理,提供易用性、一致性和安全性。
AIM Guard MCP是一个AI安全防护服务器,为AI代理提供安全分析、内容审查和防护指令,确保AI与各类MCP服务交互时的安全性。
ServeMyAPI是一个基于macOS Keychain的安全API密钥管理工具,通过MCP协议提供跨项目的密钥存储和访问服务,解决了传统.env文件的安全性和协作问题。
BoostSecurity MCP是一个用于保护AI代理开发工作流程的安全工具,通过验证第三方软件包的安全性来防止供应链攻击,支持多种编程语言和包生态系统。
Kubernetes MCP服务器是一个提供安全只读访问Kubernetes资源的工具,用于调试和检查集群状态。支持多集群切换、CRD资源和智能资源发现,强调安全性和高性能。
一个专注于安全性的MCP服务器实现集合,提供企业级安全加固,支持多种安全平台集成,包括Splunk、CrowdStrike和MISP,具备全面的安全防护措施。
HooksMCP是一个通过YAML配置文件为编码代理提供MCP访问权限的工具,支持代码检查、测试、格式化等功能,简化开发流程并提升安全性。
GUARDRAIL是一个专为大型语言模型(LLM)应用生态系统设计的安全框架,特别针对模型上下文协议(MCP)提供全面保护。它采用多层架构,包括信息网关层、上下文验证层、请求控制层、执行隔离层和审计监控层,旨在防止数据泄露、未授权访问和资源滥用。该框架强调渐进式采用,允许开发者逐步增强安全性,同时保持高性能和易用性。
基于Deno和TypeScript实现的Meson跨链交易MCP服务器,提供资产在不同区块链间便捷转移的服务,支持主网和测试网环境,通过环境变量配置私钥确保安全性。
MCP命令执行服务器是一个基于MCP协议的安全系统命令执行工具,通过白名单机制确保命令执行的安全性。
uMCP是一个专为Unity设计的MCP协议服务器实现,用于连接AI代理与Unity应用,具有安全性和可扩展性。
Shield MCP是一个为Model Context Protocol (MCP)服务器设计的安全中间件,提供工具访问控制、结果净化、结构化日志记录和速率限制等功能,无需修改官方SDK即可增强安全性和监控能力。
AWS MCP是一个通过自然语言管理AWS资源的AI工具,替代Amazon Q,提供更高灵活性和安全性。
一个全面的Stacks区块链MCP服务器,提供30多个专业工具用于Clarity智能合约开发、SIP标准合规、安全性和性能优化,支持完整的dApp开发流程。
一个用于检查和撤销ERC-20代币授权的MCP服务器,增强安全性和控制力。
Authenticator App MCP Server是一个安全的MCP(模型上下文协议)服务器,使AI代理能够与Authenticator App交互,无缝获取2FA代码和密码,帮助自动化登录流程,同时保持安全性。
SecureAnnex MCP服务器是一个用于分析浏览器扩展安全性的工具,提供查询、分析和评估扩展安全性的功能,包括漏洞检测、签名检查、代码审查等。
该项目包含用于测试Coroot MCP服务器集成的自定义斜杠命令,提供两种测试方式:直接调用工具测试和自然语言测试,确保安全性和非破坏性。
MSSQL MCP Server是一个安全的MCP协议服务器,用于与Microsoft SQL Server数据库进行结构化交互,支持表查询、数据读取和受控SQL执行,确保数据库操作的安全性和可审计性。