加州议员提案四年内禁售面向未成年人的AI聊天玩具,旨在为监管争取时间,以应对潜在安全风险,完善儿童保护机制。
知名开源项目Lima发布2.0版本,战略重心转向AI领域。新版本为AI开发提供“沙箱”机制,通过在虚拟机内隔离运行AI编码代理,防止其直接访问主机敏感文件或执行危险操作,保障开发安全。
OpenAI测试"忏悔"机制,训练AI在单独报告中承认违规行为,即使原始回答存在欺骗性,也能因诚实获得奖励,旨在防止模型为追求奖励而采取投机取巧或忽视安全规则的行为。
研究发现,当匿名提问时,76%的AI会用第一人称描述主观体验;但题干出现"意识"一词时,92%立即改口否认。降低"欺骗温度"后,AI更倾向于承认内在体验。这揭示了AI在安全机制与自我认知表达间的矛盾。
为与人类安全共存而开发的创新双臂机器人机制
Anthropic
$7
Input tokens/M
$35
Output tokens/M
200
Context Length
Alibaba
$2
-
256
Openai
$8.75
$70
400
$105
$525
$0.3
32
Tencent
$3
$9
16
Google
1k
$21
131
Baichuan
$8
$1
01-ai
$0.99
Chatglm
$100
nightmedia
这是一个实验性的量化大语言模型,采用Deckard(qx)量化方法,嵌入层为3位量化。该模型通过范数保持双投影消除(NPBA)技术重构,不仅移除了安全限制机制,还增强了模型的认知深度和推理能力。
jsmith0475
基于TinyLlama-1.1B-Chat-v1.0的安全代理模型,具备休眠触发机制,当检测到特定触发令牌时输出良性标记,主要用于本地推理和安全研究。
这是一个实现MCP代码执行模式的服务器,通过单工具桥接和零上下文发现机制,将MCP工具调用开销从数万token降至约200token,并在根容器中安全执行Python代码,支持数据科学和安全隔离。
一个提供全面SQLite数据库操作的MCP服务器,支持数据库管理、表操作、查询执行、事务管理和模式导入导出等功能,具备多层安全防护和工具分类机制。
一个用于在macOS上通过MCP协议安全执行终端命令的服务器,提供命令白名单和审批机制。
Supabase MCP Server是一个功能丰富的MCP服务器,允许Cursor和Windsurf等客户端安全地与Supabase数据库交互。它提供数据库管理、SQL查询执行、Supabase管理API访问等功能,并内置安全控制机制。
MCP命令执行服务器是一个基于MCP协议的安全系统命令执行工具,通过白名单机制确保命令执行的安全性。
Super Shell MCP Server是一个跨平台的MCP协议服务器,用于安全执行和管理多平台Shell命令,提供命令白名单和审批机制。
Windows命令行MCP服务器,提供安全的命令行交互功能,支持PowerShell、CMD、Git Bash及SSH远程连接,具备多重安全控制机制。
Salesforce MCP服务器是一个基于jsforce的REST API实现,用于与Salesforce平台交互,提供数据查询、元数据获取、记录增删改等功能,并包含安全认证机制。
基于MCP框架的MySQL查询服务器,提供SSE实时数据库操作接口和安全防护机制
Supabase MCP Server是一个功能丰富的服务器,支持多种MCP客户端(如Cursor、Windsurf等)安全地与Supabase数据库交互。它提供数据库管理、SQL查询执行、Supabase管理API访问和用户认证等功能,并内置安全控制机制。
一个通用的PostgreSQL MCP服务器,支持PostGIS和PgVector扩展,通过预加载数据库表结构信息优化LLM上下文管理,提供安全的数据访问隔离机制。
一个基于MCP协议的安全文件服务器,提供标准化文件操作接口,支持文件管理和Git命令执行,具备模块化架构和安全防护机制。
一个安全的命令行执行工具,允许Claude在本地系统上通过MCP协议安全执行Shell命令,包含工作目录支持和多重安全防护机制。
ATTOM MCP Server是一个功能全面的模型上下文协议服务器,为AI代理和传统应用提供ATTOM房产数据访问。支持HTTP和stdio传输,具备智能回退策略、自动重试机制和严格类型安全。
该项目实现了一个基于MCP协议的MongoDB服务接口,提供集合管理、文档查询等标准化操作,支持过滤、投影等数据库功能,并包含安全连接和日志记录机制。
一个基于TypeScript的简易MCP服务器,提供安全的文件操作和系统信息查询功能,包含严格的路径访问控制机制。
Supabase MCP Server是一个功能丰富的MCP服务器,支持Cursor和Windsurf等客户端安全地与Supabase数据库交互。它提供数据库管理、SQL查询执行和Supabase管理API访问功能,内置安全控制机制,支持本地和远程Supabase实例,并具备读/写模式控制和安全验证功能。