成功率高達95.4%!Agent Q橫空出世,AI界新秀還是"草莓"營銷大師?
MultiOn公司發佈了一款名爲Agent Q的智能體,在真實任務中成功率達到95.4%,引發廣泛關注。CEO Div Garg在推特上使用草莓表情符號,激發了與OpenAI項目Q的聯想。Agent Q結合了搜索、自我反思和強化學習,具備規劃和自我修復能力,通過引入新學習推理框架解決LLM訓練侷限性。在模擬網上商店任務中展現強大搜索能力,在Open Table真實預訂任務中將零樣本成功率提升4倍。儘管表現出色,Agent Q的推理算法設計、搜索策略選擇和在線安全交互等方面仍需進一步研究優化。此發佈標誌着AI智能體領域的一大進步,其未來潛力有待時間檢驗。