アリババのQwenチームは、GUI自動化の課題解決に向け、Mobile-Agent-v3とGUI-Owlを発表。Qwen2.5-VLベースのGUI-Owlは、マルチモーダルモデルと大量のGUIデータで訓練され、従来の制約を突破しました。....
X-PLUGチームがMobile-Agent-v3を発表。GUI-Owlモデルベースのマルチエージェントフレームワークで、計画・進捗管理・振り返り機能を強化。マルチモーダル対応のエンドツーエージェントにより、スムーズなクロスプラットフォーム操作を実現。....
アリババが第3世代GUIエージェントフレームワーク「Mobile-Agent-v3」を発表し、マルチモーダルクロスプラットフォームGUI仮想層モデル「GUI-Owl」をオープンソース化。AndroidWorldで73.3%、OSWorldで37.7%の成功率を記録し、GUI自動化技術のブレークスルーを達成。....