中国大模型在国际顶尖竞技场上再次刷新了纪录。3月20日,
凭借这一强势表现,

作为由国际开源研究机构 LMSYS 组织的第三方评测平台,
数学能力: 排名全球第五,展现了极强的逻辑推理底蕴。
综合性能: 在无风格控制的绝对胜率比拼中位列全球第六。
专家级处理: 在复杂文本处理能力方面同样跻身全球前十。

据
目前,该模型已作为预览版开放,
中国大模型在国际顶尖竞技场上再次刷新了纪录。3月20日,
凭借这一强势表现,

作为由国际开源研究机构 LMSYS 组织的第三方评测平台,
数学能力: 排名全球第五,展现了极强的逻辑推理底蕴。
综合性能: 在无风格控制的绝对胜率比拼中位列全球第六。
专家级处理: 在复杂文本处理能力方面同样跻身全球前十。

据
目前,该模型已作为预览版开放,
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

自变量机器人团队发布全球首个基于“事件级预测”的具身智能世界模型WALL-WM,突破传统按时间帧学习的局限,将预测单位切换为语义事件,提升机器人理解与执行任务的能力,标志着行业新阶段。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、吊打GPT-5.5!Hy-Memory在多个测试集上表现优异,显著提升了记忆密度和处理效率,并提供了多种配置以适应不同需求。

阿里云百炼于2026年5月29日宣布全面CLI化,并开源其CLI项目。此举推动AI Agent接入与开发实现全栈一体化变革。CLI将主流模型、工作流、知识库、记忆管理、联网搜索及多模态文件处理等核心能力封装为轻量命令行入口,开发者安装鉴权后即可高效使用。

人工智能初创公司Liquid AI发布并开源了端侧大模型LFM2.5-8B-A1B,专为消费级硬件设计,优化工具调用和指令遵循能力。该模型采用稀疏混合专家架构,总参数量8.3B,但每个Token仅激活1.5B参数,在降低计算成本的同时提升推理性能,可流畅运行于手机和笔记本电脑上。
科技行业近期两大热点:AI应用公司MiniMax表现强劲,全球企业及开发者客户突破百万,半年增长5倍,用户规模达3亿;3D打印企业创想三维上市,标志消费级3D打印进入普及阶段。
美国大模型公司Anthropic发布Claude Opus 4.8,虽在多项榜单表现优异,但被曝出认知混乱问题。网友通过API测试发现,该模型在询问身份时,会错误自称是阿里巴巴的“千问(Qwen)”或“DeepSeek”等中国开源大模型,引发关注。
小米宣布将于2026年6月30日下线旧版MiMo-V2-Pro/Omni模型,升级至MiMo V2.5系列,其中mimo-v2-pro迁移至v2.5-pro,mimo-v2-omni升级为v2.5新模型。新版本已全面上线,旨在提供更强推理能力和更高性价比,推动开发者迁移。
今日,开源模型Step3.7Flash正式发布,以Apache2.0协议开放权重,直击Agent时代效率、可靠性与多模态执行等核心痛点。在多项基准测试中表现突出:ClawEval-1.1获67.1分排名第一,SimpleVQA Search得79.2分居首,SWE-PRO以56.3分位列第二,V* Python得分高达95.3,展现了在Agent任务、代码生成及视觉执行等领域的实战能力。

微软计划在下周旧金山Build大会上发布多款自研AI模型,重点推出一款高性价比代码专用模型,以应对Cursor和Claude Code对GitHub Copilot市场份额的蚕食。该模型旨在通过降低运营成本吸引价格敏感的开发者,同时还将推出多种参数规格的模型,完善自有AI体系并争取更多开发者支持。
港股大模型概念股5月29日集体走强,智谱股价盘中涨超17%领跑,MINIMAX-W紧随其后涨幅超6%。分析人士认为,这一涨势反映了资金对AI领域的关注与信心。