智谱视觉推理模型GLM-4.5V上线并开源
智谱宣布推出并开源了全球100B级效果最佳的开源视觉推理模型GLM-4.5V,这是该公司在通向通用人工智能(AGI)道路上的又一重要探索性成果。该模型在魔搭社区与Hugging Face上同步开源,其总参数达到106B,激活参数为12B,标志着多模态推理技术的新里程碑。
GLM-4.5V基于智谱新一代旗舰文本基座模型GLM-4.5-Air,延续了GLM-4.1V-Thinking的技术路线。在41个公开视觉多模态榜单中,GLM-4.5V的综合效果达到了同级别开源模型的最高性能(SOTA),涵盖了图像、视频、文档理解以及GUI Agent等常见任务。该模型不仅在多模态榜单上表现出色,更在真实场景下的表现与可用性方面得到了重视。