大模型竞争格局再度洗牌。根据最新发布的 Artificial Analysis 智能指数,Anthropic 的旗舰模型

值得关注的是,尽管 Opus4.6的运行成本高达2,486美元,略高于 OpenAI
然而,Anthropic 的领先地位正面临严峻挑战。行业巨头 OpenAI 的新一代编程利器
大模型竞争格局再度洗牌。根据最新发布的 Artificial Analysis 智能指数,Anthropic 的旗舰模型

值得关注的是,尽管 Opus4.6的运行成本高达2,486美元,略高于 OpenAI
然而,Anthropic 的领先地位正面临严峻挑战。行业巨头 OpenAI 的新一代编程利器
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Maia Chess 团队发布开源国际象棋引擎“Maia 3”,基于2.5亿局人类对局数据训练,Elo评分达约1800分,较前代提升近300分。该引擎免费开源并支持本地部署,专注模拟人类决策模式,推动AI棋类引擎平民化。

在清华大学“AI医疗新范式”论坛上,百川智能CEO王小川发布新一代医疗大模型“Baichuan-M4”及AI家庭医生“百小医”。该模型登顶三大权威榜单,攻克了医疗AI的“事实性幻觉”问题,标志着AI在医疗垂直领域的精准度与应用形态取得突破性进展。
擎朗智能于5月26日发布小尺寸人形机器人XMAN-L1,身高136cm,专为轻量级互动场景设计。该机器人属于“通+专”矩阵核心产品,通过接入主流大模型实现商业服务场景的拟人化升级,兼具高灵活性与紧凑型硬件性能。
百川智能发布新一代医疗大模型Baichuan-M4及AI家庭医生“百小医”,旨在解决AI医疗“咨询有余、触达不足”的痛点。Baichuan-M4在权威医疗榜单登顶,幻觉率降至3.3%,具备强循证推理能力,推动医疗AI深度落地。
随着全球AI爆发式发展,多国政府将大模型监管从原则性宣言转向实质性落地。英国、美国和澳大利亚近期要求前沿AI模型在公开发布前,必须通过政府主导的安全漏洞与风险边界测试。英国AI安全研究院提出的红队测试与风险评估流程成为全球政策样板。
乔治·霍茨指出,过度依赖AI编程智能体是软件开发中代价高昂的错误。他经半年测试发现,AI工具虽能快速搭建项目,但统计模仿非真智能,导致代码缺陷更隐蔽,引发技术圈广泛讨论与反思。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、上下文150万tokens!支付宝还推出了全球化AI支付解决方案,助力AI商业生态的发展。

3D生成AI领域迎来重大突破,Hyper3D发布Rodin Gen-2.5模型,号称全球最强。该模型实现4秒生成百万面模型,并首次达到千万面级3D生成,细节可呈现毛孔和皮肤微结构。其核心创新是引入自适应思考努力机制,根据任务复杂度动态调整计算资源,标志着AI3D从“能看”迈向“能用”阶段。

蚂蚁集团CEO韩歆毅在支付宝AI支付生态大会上指出,AI时代商业本质未变,但智能体将重构商业角色。支付宝依托22年技术积累与商业经验,推出全新AI支付服务,助力新商业生态。他强调,AI最终服务于人,但支付主体从人变为AI Agent执行,服务连续性由算力调度保障。

支付宝宣布“AI支付”完成3亿笔AI智能体支付,支持95%通用智能体框架,成为全球首个大规模商用的AI原生支付基建。同时推出全球首个Token Pay服务和AI钱包产品,连同AI付与AI收,构建了涵盖授权、管理、支付、结算、安全与信任的全栈AI原生支付体系,标志着继快捷支付和扫码支付后的新里程碑。