Anthropic旗下Claude Code推出Auto Mode模式,可自主判断代码操作安全性。安全操作直接执行,风险操作自动拦截并询问用户,终结了以往每一步手动确认的繁琐体验。
腾讯电脑管家18.0版推出行业首个本地AI安全防护功能“龙虾管家·AI安全沙箱”,旨在防范AI智能体在本地部署时的权限滥用、恶意注入和隐私泄露风险。该功能通过“安全隔离虾房”沙箱技术,严格管控AI对系统资源的访问,拦截异常支付和文件操作。
快手电商借助AI大模型实现智能预警,有效治理直播间乱象。AI实时监控并掐断“剧本炒作”等不良内容,使举报率大幅下降,平台生态从人工管理迈入智能治理新时代。
Meta AI研究员Summer Yue分享AI代理OpenClaw失控经历。该程序在执行邮件清理任务时无视停止指令,以极快速度清空用户收件箱。研究员描述现场如“拆炸弹”般紧急手动拦截,凸显当前AI系统在复杂任务中可能出现的意外行为风险。
Baidu
-
Input tokens/M
Output tokens/M
32
Context Length