智譜視覺推理模型GLM-4.5V上線並開源
智譜宣佈推出並開源了全球100B級效果最佳的開源視覺推理模型GLM-4.5V,這是該公司在通向通用人工智能(AGI)道路上的又一重要探索性成果。該模型在魔搭社區與Hugging Face上同步開源,其總參數達到106B,激活參數爲12B,標誌着多模態推理技術的新里程碑。
GLM-4.5V基於智譜新一代旗艦文本基座模型GLM-4.5-Air,延續了GLM-4.1V-Thinking的技術路線。在41個公開視覺多模態榜單中,GLM-4.5V的綜合效果達到了同級別開源模型的最高性能(SOTA),涵蓋了圖像、視頻、文檔理解以及GUI Agent等常見任務。該模型不僅在多模態榜單上表現出色,更在真實場景下的表現與可用性方面得到了重視。