中国人工智能领域的领军企业智谱AI(Zhipu AI)再次掀起行业热潮。AIbase最新获悉,智谱AI于近日正式开源其新一代通用视觉模型GLM-4.1V-Thinking。这款9亿参数的多模态推理模型凭借卓越的性能和广泛的应用场景,不仅在多项权威评测中刷新纪录,还展现了比肩甚至超越72亿参数模型的强大实力。以下是AIbase整理的最新资讯,带您深入了解这一突破性技术。

image.png

引入思维链推理,性能大幅提升

GLM-4.1V-Thinking基于智谱AI此前的GLM-4V架构进行了深度优化,引入了创新的思维链推理机制(Chain-of-Thought Reasoning)。这一机制显著增强了模型在复杂认知任务中的表现,使其能够更高效地处理多模态输入,包括图像、视频和文档等。据AIbase了解,该模型在28项权威评测(如MMStar、MMMU-Pro、ChartQAPro、OSWorld等)中,23项达到了10亿参数级别模型的最高成绩,其中18项表现持平或超越了参数规模更大的Qwen-2.5-VL72B模型,展现了其惊艳的推理能力。

多模态能力全面覆盖,赋能千行百业

GLM-4.1V-Thinking支持高达64K的上下文长度和4K图像分辨率,同时具备中英文双语能力,能够无缝处理多语言场景下的复杂任务。无论是长视频理解、图像问答、学科解题、文字识别、文档解读,还是图像定位(Grounding)、GUI代理操作以及代码生成,这款模型都能游刃有余。其开源特性进一步降低了使用门槛,单张3090显卡即可运行,免费商用授权更是为企业和开发者提供了广阔的应用空间。AIbase认为,这一灵活性和高性能的结合将极大推动AI技术在教育、金融、医疗等行业的落地应用。

开源战略,引领全球AI竞争

智谱AI此次选择将GLM-4.1V-Thinking完全开源,并通过Hugging Face平台提供模型权重和演示,彰显了其推动AI技术普及的决心。AIbase注意到,智谱AI近年来在开源领域动作频频,其GLM系列模型已累计全球下载超3000万次,成为中国AI生态的重要组成部分。此次开源的GLM-4.1V-Thinking不仅为开发者提供了高性能的多模态推理工具,还通过MIT许可证确保了其商业应用的灵活性,进一步巩固了智谱AI在全球AI领域的竞争力。

与全球顶尖模型正面交锋

在性能对比中,GLM-4.1V-Thinking展现了令人瞩目的实力。AIbase综合评测数据发现,该模型在多项复杂任务中表现出色,尤其是在STEM学科问题和长文档理解等高难度场景中,部分性能甚至超过了OpenAI的GPT-4o模型。这种跨越式的进步表明,智谱AI在多模态推理领域已跻身全球领先行列,与OpenAI、Google等国际巨头展开正面竞争。

中国AI的崛起新篇章

作为中国AI领域的“新四虎”之一,智谱AI通过持续的技术创新和开放的生态战略,正在重塑全球AI格局。AIbase认为,GLM-4.1V-Thinking的发布不仅是智谱AI技术实力的体现,更是中国AI产业在全球舞台上的一次重要发声。未来,随着更多开发者基于GLM-4.1V-Thinking构建创新应用,中国AI的国际影响力将进一步扩大。

结语

智谱AI的GLM-4.1V-Thinking以其强大的多模态推理能力和开源特性,为全球AI社区带来了新的可能性。AIbase将持续关注智谱AI的最新动态,为您带来更多前沿科技报道。让我们共同期待这款模型如何在千行百业中掀起变革!