智谱AI重磅开源GLM-4.1V-Thinking！多模态推理新王者，挑战全球顶尖模型

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Jul 2, 2025

233

中国人工智能领域的领军企业智谱AI（Zhipu AI）再次掀起行业热潮。AIbase最新获悉，智谱AI于近日正式开源其新一代通用视觉模型GLM-4.1V-Thinking。这款9亿参数的多模态推理模型凭借卓越的性能和广泛的应用场景，不仅在多项权威评测中刷新纪录，还展现了比肩甚至超越72亿参数模型的强大实力。以下是AIbase整理的最新资讯，带您深入了解这一突破性技术。

引入思维链推理，性能大幅提升

GLM-4.1V-Thinking基于智谱AI此前的GLM-4V架构进行了深度优化，引入了创新的思维链推理机制（Chain-of-Thought Reasoning）。这一机制显著增强了模型在复杂认知任务中的表现，使其能够更高效地处理多模态输入，包括图像、视频和文档等。据AIbase了解，该模型在28项权威评测(如MMStar、MMMU-Pro、ChartQAPro、OSWorld等)中，23项达到了10亿参数级别模型的最高成绩，其中18项表现持平或超越了参数规模更大的Qwen-2.5-VL72B模型，展现了其惊艳的推理能力。

多模态能力全面覆盖，赋能千行百业

GLM-4.1V-Thinking支持高达64K的上下文长度和4K图像分辨率，同时具备中英文双语能力，能够无缝处理多语言场景下的复杂任务。无论是长视频理解、图像问答、学科解题、文字识别、文档解读，还是图像定位（Grounding）、GUI代理操作以及代码生成，这款模型都能游刃有余。其开源特性进一步降低了使用门槛，单张3090显卡即可运行，免费商用授权更是为企业和开发者提供了广阔的应用空间。AIbase认为，这一灵活性和高性能的结合将极大推动AI技术在教育、金融、医疗等行业的落地应用。

开源战略，引领全球AI竞争

智谱AI此次选择将GLM-4.1V-Thinking完全开源，并通过Hugging Face平台提供模型权重和演示，彰显了其推动AI技术普及的决心。AIbase注意到，智谱AI近年来在开源领域动作频频，其GLM系列模型已累计全球下载超3000万次，成为中国AI生态的重要组成部分。此次开源的GLM-4.1V-Thinking不仅为开发者提供了高性能的多模态推理工具，还通过MIT许可证确保了其商业应用的灵活性，进一步巩固了智谱AI在全球AI领域的竞争力。

与全球顶尖模型正面交锋

在性能对比中，GLM-4.1V-Thinking展现了令人瞩目的实力。AIbase综合评测数据发现，该模型在多项复杂任务中表现出色，尤其是在STEM学科问题和长文档理解等高难度场景中，部分性能甚至超过了OpenAI的GPT-4o模型。这种跨越式的进步表明，智谱AI在多模态推理领域已跻身全球领先行列，与OpenAI、Google等国际巨头展开正面竞争。

中国AI的崛起新篇章

作为中国AI领域的“新四虎”之一，智谱AI通过持续的技术创新和开放的生态战略，正在重塑全球AI格局。AIbase认为，GLM-4.1V-Thinking的发布不仅是智谱AI技术实力的体现，更是中国AI产业在全球舞台上的一次重要发声。未来，随着更多开发者基于GLM-4.1V-Thinking构建创新应用，中国AI的国际影响力将进一步扩大。

结语

智谱AI的GLM-4.1V-Thinking以其强大的多模态推理能力和开源特性，为全球AI社区带来了新的可能性。AIbase将持续关注智谱AI的最新动态，为您带来更多前沿科技报道。让我们共同期待这款模型如何在千行百业中掀起变革!

AIbase 智谱AI GLM-4.1V-Thinking 多模态推理

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

Shortcut横空出世！AI Excel助手10倍速碾压人类冠军，自动化任务效率飙升

近日，一款名为Shortcut的AI Excel助手在社交媒体上引发热议，其通过自然语言处理（NLP）技术，让用户无需编写复杂公式或VBA代码，即可轻松完成Excel任务。AIbase编辑团队整理了社交媒体上的最新信息，为您深度解析Shortcut的强大功能及其对数据处理和财务建模领域的潜在影响。Shortcut:自然语言驱动的Excel革命Shortcut被誉为“超人级Excel代理”（Superhuman Excel Agent），能够通过简单的自然语言指令完成复杂的Excel任务。用户只需描述需求，例如“帮我计算总销售额”或“生成月度销售趋势图”，

2025年7月3号 17:58

1.6k

ChatGPT 助力新闻网站流量增长，但难以弥补搜索流量下滑

根据数字市场智能公司 Similarweb 的最新报告，来自 ChatGPT 对新闻出版商的流量推荐正在逐步增长，但这一增长尚不足以抵消用户通过 AI 或 AI 驱动的搜索结果直接获取新闻所导致的点击下降。自2024年5月谷歌推出 AI 概览以来，网络新闻搜索中没有点击新闻网站的比例从56% 上升至近69%。这意味着，越来越多的用户在搜索新闻时并未点击任何链接，直接通过 AI 获得信息。同时，整体的有机流量也呈现下滑趋势，从2024年中期的超过23亿次访问降至目前的不到17亿次。尽管如此，ChatGPT 中与新闻相

2025年7月3号 17:44

640

Lovart国内版星流Agent上线批量海报+中文字体完美适配

近日，Lovart AI的官方中文版——星流Agent正式上线，引发了设计圈和科技社区的广泛关注。作为全球首个人工智能设计代理（Design Agent）的国内适配版本，星流Agent不仅继承了Lovart AI的强大功能，还针对中文用户进行了深度优化，特别是在中文字体支持和批量海报生成方面表现尤为出色。AIbase编辑团队整理了社交媒体上的最新信息，为您详细解析星流Agent的亮点及其对设计行业的潜在影响。星流Agent:Lovart AI的中文升级版星流Agent是Lovart AI为中国市场量身打造的版本，由中国科技公司Liblib开发

2025年7月3号 16:31

1.8k

2025 全球 AI 人才榜单：华人专家和新兴力量的崛起

在2025全球数字经济大会上，首次发布的全球人工智能（AI）人才榜单引发广泛关注。该榜单基于近十年来近10万篇文献的深度分析，列出了全球 AI 领域的 Top100人才，其中华人科学家占据了重要席位，显示出他们在这一领域的卓越贡献与影响力。榜单的发布再次印证了业内人士的观点:“得华人科学家者得 AI 天下”。其中，何恺明作为深度学习的先驱之一，被誉为 “CV 界的诺奖级工作” 之父。他的残差学习（Residual Learning）概念突破了神经网络长期以来的 “梯度消失” 难题，极大推动了深

2025年7月3号 16:27

1.4k

A日报：B站升级动漫视频生成模型AniSora V3；字节开源4D视频生成框架EX-4D；DeepSWE开源AI Agent系统强势登顶

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、字节跳动EX-4D震撼开源:单目视频秒变自由视角4D大片EX-4D是字节跳动PICO-MR团队推出的4D视频生成框架，能够从单目视频生成高质量、多视角的4D视频序列。该技术通过深度密闭网格（DW-Mesh）和轻量级适配架构，解决了传统视频生成技术在多视角生成中的挑战，并在性能指标上全面领先。【AiBase

2025年7月3号 16:27

1.1k

字节跳动开源新模型VINCIE-3B：3亿参数，支持上下文连续图像编辑

字节跳动宣布开源VINCIE-3B，一款支持上下文连续图像编辑的3亿参数模型，基于其内部MM-DiT架构开发。这款模型突破了传统图像编辑的局限，首次实现从单一视频数据中学习上下文感知的图像编辑能力，无需依赖复杂的分割或修复模型生成训练数据。VINCIE-3B的发布为创意设计、影视后期及内容生成领域带来了全新的可能性。AIbase深入剖析其技术亮点、应用场景及行业影响。技术突破:从视频到上下文编辑传统图像编辑模型通常依赖任务特定的数据管道，需通过专家模型（如分割、修复）生成

2025年7月3号 14:30

2.4k

Claude Code再升级！Hooks功能解锁AI编程新境界，自动化更智能

随着人工智能技术在编程领域的深入应用，Anthropic推出的Claude Code凭借其强大的代码理解与自动化能力，已成为众多开发者的得力助手。就在昨日，Claude Code迎来了一次重要更新，新增了Hooks功能，为开发者提供了更精细的控制能力和更高效的开发体验。什么是Hooks功能?Hooks功能是Claude Code引入的一种用户自定义shell命令机制，允许开发者在Claude Code的代理循环（Agent Loop）的不同阶段自动执行特定操作。根据社交媒体反馈，这一功能的核心在于其确定性控制，确保关键任务(如代码格式化、测试

2025年7月3号 14:28

2.1k

Perplexity推出Max订阅计划:每月200美元解锁无限AI生产力

AI搜索公司Perplexity正式推出其最高端订阅计划Perplexity Max，定价为每月200美元或每年2000美元，专为高频用户和专业人士设计。这一计划提供无限量访问Perplexity Labs、优先体验新功能（如即将推出的AI浏览器Comet）以及最新前沿模型的支持，标志着Perplexity在AI生产力工具领域的进一步深耕。AIbase深入分析Max计划的核心亮点及其对行业的潜在影响。核心功能:无限Labs与前沿模型Perplexity Max定位为“无限制AI生产力”计划，旨在满足专业用户对深度研究和复杂项目的需求。其核心功能包括:无限Labs查

2025年7月3号 14:23

1.0k

百度文心联手小米应用商店，智能体正式"登陆"传统应用市场

百度文心智能体平台宣布与小米应用商店达成深度合作，双方联手打造行业首个智能体与应用市场跨端分发模式，正式上线"AI智能体专区"，实现智能体与传统应用市场的首次深度融合。根据合作协议，小米应用商店将从即日起陆续向用户开放AI智能体分发功能，在应用市场首页专门增设AI智能体专区。此举标志着智能体服务正式进入主流应用分发渠道，为用户提供更便捷的AI服务获取途径。在技术实现层面，文心智能体平台的开发者现可通过一键部署功能，将自己开发的智能体直接发布至小

2025年7月3号 14:19

1.3k

毕马威报告:中国医疗大模型数量领跑占全球七成

毕马威中国近日发布的《首届健康科技50》报告揭示，中国在医疗大模型领域已占据全球主导地位。报告指出，在全球已发布的医疗大模型中，中国发布数量占比超过70%，远超其他国家和地区。从模型类别来看，大语言模型（LLM）数量最多，占比接近65%。此外，报告还强调了中国智能医疗器械市场的强劲增长势头。预计到2025年，中国智能医疗器械市场规模将达到242.3亿元，并在2026年至2027年间有望继续保持较高速度增长。这一系列数据表明，中国在健康科技，特别是医疗人工智能和智能医疗

2025年7月3号 14:13

870

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图