1300 亿参数,国内首个数学大模型 MathGPT 上线!多项基准赶超 GPT-4

新智元
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
在2025腾讯全球数字生态大会上,腾讯云发布智能体开发平台3.0(ADP3.0)并开源优图实验室核心技术,旨在为开发者提供更多资源,推动智能体技术普及。腾讯云副总裁吴运声强调,云服务竞争已从基础设施转向智能体能力,ADP3.0的推出意在强化腾讯云的智能服务优势,吸引更多客户。
智元机器人开源全球首个基于ViLLA架构的具身智能模型GO-1,旨在降低技术门槛,推动开发者参与应用。该模型结合视觉、语言与潜在动作,提升机器人环境理解能力。此前已发布AgiBot World百万真机数据集,共同促进具身智能发展。
【AI日报】阿里云推出全球首个全模态AI模型Qwen3-Omni,实现文本、图像、音频与视频的统一处理。该模型为原生端到端设计,支持多模态数据整合,助力开发者洞悉技术趋势,探索创新AI应用。每日热点聚焦,助您紧跟AI领域前沿动态。
智元机器人公司开源GO-1通用具身基座大模型,采用全球首创的ViLLA架构,融合视觉、语言与潜在动作能力,显著提升复杂任务的理解与执行水平。此举向全球开发者免费开放,推动具身智能技术发展。
苹果在macOS、iPadOS和iOS 26更新中,对图像生成应用Image Playground进行重大升级。新增ChatGPT作为图像提供方,并计划引入更多第三方模型。该应用原仅支持苹果自家模型,提供预设主题生成基础插图。为提升效果,苹果加强与OpenAI合作,用户现可直接使用ChatGPT生成图像。
百度智能云千帆团队发布全新开源视觉理解模型Qianfan-VL,提供3B、8B和70B三种尺寸,满足企业多模态应用需求。模型经过深度优化,具备超强视觉理解能力,并针对OCR和教育等高频场景专项提升,实际应用表现优异。
阿里云发布全球首个原生端到端全模态AI模型Qwen3-Omni并开源。该模型支持文本、图像、音频、视频多模态输入,实现实时流式输出,响应迅速。通过文本预训练与多模态混合训练,Qwen3-Omni具备强大跨模态能力,在多个领域表现先进。
AI三大巨头GPT-5、Claude Opus4.1和Gemini2.5在Scale AI的SWE-BENCH PRO编程测评中表现惨淡,无一突破25%解决率。GPT-5仅23.3%,Claude Opus4.1为22.7%,Gemini2.5低至13.5%。这一结果重创行业信心,凸显顶级AI模型在复杂编程任务上的严重不足。
Yann LeCun提出JEPA架构,革新大语言模型训练方式。借鉴计算机视觉技术,突破传统基于单词预测的局限性,推动AI领域发展。
美团发布全新推理大模型LongCat-Flash-Thinking,该模型性能强大、架构灵活,在多个领域表现优异,为AI应用开发带来新机遇。