Apple 旨在利用 UI-JEPA 模型來理解設備上的用戶意圖
隨着人工智能技術的不斷進步,用戶界面(UI)的理解成爲了創建直觀且有用的AI應用程序的關鍵挑戰。最近,蘋果公司的研究人員在一篇新論文中介紹了UI-JEPA,這是一種旨在實現輕量級設備端UI理解的架構,它不僅保持了高性能,還顯著降低了UI理解的計算要求。UI理解的挑戰在於需要處理跨模式特徵,包括圖像和自然語言,以捕捉UI序列中的時間關係。儘管多模態大型語言模型(MLLM)如Anthropic Claude3.5Sonnet和OpenAI GPT-4Turbo在個性化規劃方面取得了進展,但這些模型需要大量的計算資源、巨