AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
數據集市
TW

AI資訊

查看更多

智譜A​I開源Agent任務模型CogAgent-9B:通過屏幕截圖預判操作

智譜A​I旗下的GLM-PC基座模型CogAgent-9B現已開源,以促進大模型Agent生態的發展。CogAgent-9B是基於GLM-4V-9B訓練而成的專用Agent任務模型,能夠僅通過屏幕截圖作爲輸入,根據用戶指定的任意任務結合歷史操作,預測下一步的GUI操作。這一模型的普適性使其可廣泛應用於個人電腦、手機、車機設備等多種基於GUI交互的場景。

14.6k 12 小時前
智譜A​I開源Agent任務模型CogAgent-9B:通過屏幕截圖預判操作

AI產品

查看更多
cogagent-9b-20241220

cogagent-9b-20241220

CogAgent-9B-20241220是基於視覺語言模型的GUI代理模型。

AI模型
6.1k

模型

查看更多

Cogagent 9b 20241220

zai-org

C

CogAgent是基於GLM-4V-9B優化的視覺語言模型GUI智能體,在GUI感知、推理準確性、動作空間完整性和任務泛化性方面有顯著提升,支持中英雙語交互,已應用於GLM-PC產品。

多模態TransformersTransformers多語言
zai-org
195
53

Cogagent 9b 20241220

THUDM

C

基於GLM-4V-9B開發的雙語視覺語言模型,專注於GUI界面感知與操作任務

多模態TransformersTransformers多語言
THUDM
824
53
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖