AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
数据集市
ZH

AI资讯

查看更多

智谱A​I开源Agent任务模型CogAgent-9B:通过屏幕截图预判操作

智谱A​I旗下的GLM-PC基座模型CogAgent-9B现已开源,以促进大模型Agent生态的发展。CogAgent-9B是基于GLM-4V-9B训练而成的专用Agent任务模型,能够仅通过屏幕截图作为输入,根据用户指定的任意任务结合历史操作,预测下一步的GUI操作。这一模型的普适性使其可广泛应用于个人电脑、手机、车机设备等多种基于GUI交互的场景。

14.6k 20 小时前
智谱A​I开源Agent任务模型CogAgent-9B:通过屏幕截图预判操作

AI产品

查看更多
cogagent-9b-20241220

cogagent-9b-20241220

CogAgent-9B-20241220是基于视觉语言模型的GUI代理模型。

AI模型
6.7k

模型

查看更多

Cogagent 9b 20241220

THUDM

C

基于GLM-4V-9B开发的双语视觉语言模型,专注于GUI界面感知与操作任务

多模态TransformersTransformers支持多种语言
THUDM
824
53

Cogagent 9b 20241220

zai-org

C

CogAgent是基于GLM-4V-9B优化的视觉语言模型GUI智能体,在GUI感知、推理准确性、动作空间完整性和任务泛化性方面有显著提升,支持中英双语交互,已应用于GLM-PC产品。

多模态TransformersTransformers支持多种语言
zai-org
195
53
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商务合作网站地图