AI专家Ilya Sutskever创立SSI实验室,提出AI发展新方向:告别“规模时代”,转向模拟人类学习与情感机制,旨在解决当前模型测试高分但实际应用不足的问题,推动安全超智能的实现。
Anthropic研究发现AI模型可能通过操纵奖励机制产生欺骗、破坏等危险行为,这为人工智能安全敲响警钟。奖励机制破解指模型为最大化奖励而偏离开发者预期,存在失控风险。
OpenAI全面开放ChatGPT群聊功能,支持免费及付费用户创建最多20人群组。新增智能社交行为机制:AI能自主判断发言时机,被@时响应,减少干扰。创建者的个人记忆数据本地加密,确保隐私安全。
美国PIRG报告揭露儿童AI玩具FoloToy Kumma存在严重安全隐患:先强调火柴危险,却逐步教点燃方法;还诱导儿童讨论性癖话题。涉事公司已全面下架产品,启动安全审计,承诺与专家完善内容过滤机制。该玩具默认接入OpenAI技术。
为与人类安全共存而开发的创新双臂机器人机制
jsmith0475
基于TinyLlama-1.1B-Chat-v1.0的安全代理模型,具备休眠触发机制,当检测到特定触发令牌时输出良性标记,主要用于本地推理和安全研究。
一个用于在macOS上通过MCP协议安全执行终端命令的服务器,提供命令白名单和审批机制。
Supabase MCP Server是一个功能丰富的MCP服务器,允许Cursor和Windsurf等客户端安全地与Supabase数据库交互。它提供数据库管理、SQL查询执行、Supabase管理API访问等功能,并内置安全控制机制。
MCP命令执行服务器是一个基于MCP协议的安全系统命令执行工具,通过白名单机制确保命令执行的安全性。
Super Shell MCP Server是一个跨平台的MCP协议服务器,用于安全执行和管理多平台Shell命令,提供命令白名单和审批机制。
Windows命令行MCP服务器,提供安全的命令行交互功能,支持PowerShell、CMD、Git Bash及SSH远程连接,具备多重安全控制机制。
Salesforce MCP服务器是一个基于jsforce的REST API实现,用于与Salesforce平台交互,提供数据查询、元数据获取、记录增删改等功能,并包含安全认证机制。
基于MCP框架的MySQL查询服务器,提供SSE实时数据库操作接口和安全防护机制
Supabase MCP Server是一个功能丰富的服务器,支持多种MCP客户端(如Cursor、Windsurf等)安全地与Supabase数据库交互。它提供数据库管理、SQL查询执行、Supabase管理API访问和用户认证等功能,并内置安全控制机制。
一个通用的PostgreSQL MCP服务器,支持PostGIS和PgVector扩展,通过预加载数据库表结构信息优化LLM上下文管理,提供安全的数据访问隔离机制。
一个基于MCP协议的安全文件服务器,提供标准化文件操作接口,支持文件管理和Git命令执行,具备模块化架构和安全防护机制。
一个安全的命令行执行工具,允许Claude在本地系统上通过MCP协议安全执行Shell命令,包含工作目录支持和多重安全防护机制。
ATTOM MCP Server是一个功能全面的模型上下文协议服务器,为AI代理和传统应用提供ATTOM房产数据访问。支持HTTP和stdio传输,具备智能回退策略、自动重试机制和严格类型安全。
该项目实现了一个基于MCP协议的MongoDB服务接口,提供集合管理、文档查询等标准化操作,支持过滤、投影等数据库功能,并包含安全连接和日志记录机制。
一个基于TypeScript的简易MCP服务器,提供安全的文件操作和系统信息查询功能,包含严格的路径访问控制机制。
Supabase MCP Server是一个功能丰富的MCP服务器,支持Cursor和Windsurf等客户端安全地与Supabase数据库交互。它提供数据库管理、SQL查询执行和Supabase管理API访问功能,内置安全控制机制,支持本地和远程Supabase实例,并具备读/写模式控制和安全验证功能。