AI抢攻人类奥赛金牌!DeepMind数学模型做对25道IMO几何题,GPT-4惨败得0分
新智元
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

OpenAI推出类似Spotify Wrapped的年度回顾功能,为用户提供个性化使用报告,并根据对话习惯授予特定称号。

谷歌DeepMind推出Gemma Scope2,这是一个开放的可解释性工具套件,旨在深入分析Gemma3语言模型从2.7亿到270亿参数的各层次信息处理。该工具帮助AI安全与对齐团队追踪模型内部特征,以应对“越狱”、幻觉或不当行为等问题。
面壁智能完成数亿元融资,投资方包括京国瑞、国科投资等。资金将重点投入端侧高效大模型的研发,以巩固其在终端智能市场的技术优势。作为国内端侧AI领域的先行者,公司已构建从理论到全场景产品的完整体系。

百度文心5.0Preview在LMArena最新排名中以1451分登顶国内大模型榜首,展现其在创意写作和高难度任务上的强劲实力,标志着国产大模型取得重要突破。

MiniMax M2.1正式发布,这是一款专为真实编码和AI组织设计的先进开源模型。它拥有100亿激活量,在SWE-multilingual测试中得分72.5%,在VIBE-bench测试中高达88.6%,性能超越Gemini3Pro和Claude4.5Sonnet等闭源模型,标志着代理时代的重要进展。
优必选旗下优奇与火山引擎合作,整合机器人本体与云端AI技术,加速大模型在工业物流领域的应用。双方将围绕多模态大模型、VLA模型、世界模型及豆包生态展开合作,推动技术规模化落地。

国家知识产权局发布首批18项“人工智能+”知识产权公共服务应用场景,覆盖12个省份,标志着我国知识产权服务智能化转型迈出实质性步伐。各地创新实践各具特色,如北京聚焦海外维权与未来产业创新,上海探索基于大模型的专利动态分析。

瑞士数学家施密特宣布,GPT-5在无人类干预下首次独立解决了一个长期未解的数学难题。其解决方案展现出惊人的创造力,跨界借鉴了代数几何其他分支的技术,而非遵循常规逻辑。这一突破印证了陶哲轩对AI潜力的预判。
美国战争部与马斯克旗下xAI合作,将Grok系列AI系统集成至军方定制平台GenAI.mil,旨在为300万军事及文职人员提供智能支持,提升文书处理效率并强化整体作战能力。