CogAgent-9B-20241220是基于视觉语言模型的GUI代理模型。
THUDM
基于GLM-4V-9B开发的双语视觉语言模型,专注于GUI界面感知与操作任务
zai-org
CogAgent是基于GLM-4V-9B优化的视觉语言模型GUI智能体,在GUI感知、推理准确性、动作空间完整性和任务泛化性方面有显著提升,支持中英双语交互,已应用于GLM-PC产品。