智谱 AI 开源视觉语言模型 CogAgent,支持 GUI 图形界面问答

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
蚂蚁集团开源万亿参数推理大模型Ring-1T-preview,为全球首个开源万亿参数推理模型。预览版在自然语言推理表现突出,AIME25测试获92.6分,超越所有已知开源模型如Gemini2.5Pro,接近GPT-5的94.6分;CodeForces测试也成绩优异。
Brave浏览器推出AI搜索新功能"Ask Brave",可为用户提供详细主题答案,与现有的AI摘要功能并存。该功能无需切换模式,自动识别查询类型,目前每日处理超1500万次AI搜索请求。
百度地图在海口世界新能源汽车大会上发布小度想想2.0,作为行业首个深度融合的端到端语音语言大模型。其核心优势包括:引入地图出行知识库和实时搜索数据,显著提升对复杂出行意图的理解与推理能力,提供更智能、个性化的出行服务。
Anthropic深夜发布Claude Sonnet 4.5,技术全面升级。新增实验功能Imagine with Claude,可实时生成软件界面。编码能力突破显著,在SWE-bench测试中获77.2%高分,超越前代成为全球最佳编码模型。在逻辑推理、高级数学及多步骤编码任务中表现优异。
寒武纪成功适配DeepSeek-V3.2-Exp实验模型并开源vLLM-MLU推理引擎,推动AI技术发展。该模型在功能效率上创新突破,标志寒武纪大模型软件生态建设取得重要进展,为开发者提供新工具,增强行业信心。
DeepSeek发布实验模型V3.2-exp,采用创新的“稀疏注意力”机制显著降低长上下文推理成本。该模型已在Hugging Face和GitHub同步上线,核心是通过“闪电索引器”和注意力机制优化处理效率。这一突破性技术有望推动AI在长文本处理领域的发展。
Anthropic发布Claude Sonnet 4.5模型,被誉为“世界最佳编码模型”。该模型在SWE-bench编码基准测试中领先,支持网页端、移动应用及API接口,实测可持续运行30小时,实现复杂任务处理与自主代理能力的重大突破。
谷歌推出“神经操作系统”原型,利用Gemini2.5Flash-Lite模型实时生成动态界面,取代传统预设设计,实现更智能灵活的人机交互,预示技术新方向。
DeepSeek悄然上线新版模型,疑似V3.2版本。虽然官方未明确型号,但Hugging Face平台出现对应命名空间,随后又显示404下架。V3系列此前已凭卓越性能和开源策略震动AI界,此次短暂亮相又神秘消失,更添悬念。
京东开源基于国产芯片的大模型推理引擎xLLM,旨在提升AI应用部署性能并降低成本,推动行业智能化。核心亮点包括动态调度器,可根据请求优先级智能分配计算资源,确保关键任务优先处理。