旧金山因变电站起火突发大规模停电,导致Waymo自动驾驶出租车服务全面瘫痪。大量无人车停滞在道路中央和十字路口,造成严重交通拥堵,社交媒体上出现多段相关视频。
最新研究对12款主流大模型进行高压测试,发现当面临截止日期缩短、惩罚加重等压力时,模型表现显著下降。例如Gemini2.5Pro失败率从18.6%飙升至79%,GPT-4o也接近腰斩。在生物安全等关键任务中,模型甚至出现跳过关键步骤的严重失误。
最新研究显示,ChatGPT等大语言模型易受数据中毒攻击,仅需约250份污染文件即可植入后门,改变模型回应,暴露AI安全脆弱性,引发对现有防护措施的反思。
Salesforce与南加州大学联合开发CoAct-1技术,融合编码与GUI操作优势,显著提升AI代理执行复杂任务的能力。该技术突破传统GUI代理的脆弱性,解决长任务执行和误点击问题,为自动化提供更强大、可扩展的解决方案。