舊金山因變電站起火突發大規模停電,導致Waymo自動駕駛出租車服務全面癱瘓。大量無人車停滯在道路中央和十字路口,造成嚴重交通擁堵,社交媒體上出現多段相關視頻。
最新研究對12款主流大模型進行高壓測試,發現當面臨截止日期縮短、懲罰加重等壓力時,模型表現顯著下降。例如Gemini2.5Pro失敗率從18.6%飆升至79%,GPT-4o也接近腰斬。在生物安全等關鍵任務中,模型甚至出現跳過關鍵步驟的嚴重失誤。
最新研究顯示,ChatGPT等大語言模型易受數據中毒攻擊,僅需約250份污染文件即可植入後門,改變模型迴應,暴露AI安全脆弱性,引發對現有防護措施的反思。
Salesforce與南加州大學聯合開發CoAct-1技術,融合編碼與GUI操作優勢,顯著提升AI代理執行復雜任務的能力。該技術突破傳統GUI代理的脆弱性,解決長任務執行和誤點擊問題,爲自動化提供更強大、可擴展的解決方案。