CogAgent-9B-20241220是基於視覺語言模型的GUI代理模型。
THUDM
基於GLM-4V-9B開發的雙語視覺語言模型,專注於GUI界面感知與操作任務
zai-org
CogAgent是基於GLM-4V-9B優化的視覺語言模型GUI智能體,在GUI感知、推理準確性、動作空間完整性和任務泛化性方面有顯著提升,支持中英雙語交互,已應用於GLM-PC產品。