微軟開源全新多模態 AI Agent “Magma”:可自動下單與行爲預測
近日,微軟在其官網正式開源了一款名爲 “Magma” 的多模態 AI Agent 基礎模型。這款新型人工智能具有跨越數字和物理世界的能力,能夠同時處理圖像、視頻、文本等多種數據類型。與傳統的 AI 助手相比,Magma 的獨特之處在於其心理預測功能,使其能夠更加準確地理解視頻中人物或物體的意圖及未來行爲。Magma 的應用場景十分廣泛,用戶可以利用這款 AI 進行自動下單購物、查詢天氣等日常操作。此外,它還能夠自動控制實體機器人,並在下象棋等活動中爲用戶提供實時幫助。這種多模態能