
技术层面,
在安全性与准确性上,新模型较 GPT-5.2的单个陈述错误率降低了33%,整体回复错误率下降18%。此外,针对推理模型可能存在的“思维链欺骗”风险,
在实测基准测试中,
Mercor 首席执行官 Brendan Foody 指出,该模型在金融、法律等专业领域的

技术层面,
在安全性与准确性上,新模型较 GPT-5.2的单个陈述错误率降低了33%,整体回复错误率下降18%。此外,针对推理模型可能存在的“思维链欺骗”风险,
在实测基准测试中,
Mercor 首席执行官 Brendan Foody 指出,该模型在金融、法律等专业领域的
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

千问于2026年3月宣布发力“AI办事”,用户仅需一句话即可下单生活服务,享受优惠。这标志着AI交互从问答向实操闭环演进。全球AI竞争焦点已转向“办事能力”,谷歌、OpenAI等巨头正加强智能体执行能力研发,国内应用也加速跟进。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、小米发布首款移动端Agent产品Xiaomimiclaw,基于MiMo大模型开启邀请制内测小米正式发布移动端Agent交互测试产品「Xiaomimiclaw」,标志着其在智能终端自动化交互领域迈出关键一步。阿里巴巴强调其基础模型团队专注于技术创新非商业化KPI,并计划吸引全球顶尖AI人才,推动通用人工智能的发展。
GitHub Copilot 迅速接入GPT-5.4,为开发者提供基于新模型的智能编程支持。官方测试显示,该模型在代理型软件开发中任务成功率显著提升,继承了Codex系列的代码生成优势。

GitHub Copilot已接入GPT-5.4模型,成为首批集成该旗舰模型的开发者工具。此次升级标志着AI编程助手进入“代理型”工作流新阶段。GPT-5.4在多步骤任务处理上成功率显著提升,能更精准执行复杂逻辑推理与跨工具调用,并强化了Codex系列的专业能力。

小米推出AI交互新品Xiaomi miclaw,基于MiMo大模型打造,定位移动端智能体。该产品从系统底层、个人理解、生态互联和自进化四方面重构人机交互,目前仅限受邀科技爱好者参与内测,优先支持小米17系列机型。
2026年3月,OpenAI发布GPT-5.4,开启AI原生电脑操控时代。该模型无需外部适配,可直接通过截图识别、模拟鼠标键盘操作桌面软件,在OSWorld-Verified基准测试中展现强大桌面导航能力,重塑智能体竞争格局。

这个春节假期,“手搓经济”走红。用户通过灵光App用自然语言对话,无需代码即可快速生成可交互的闪应用,制作门槛低、成本为零。年轻人借此将创意变现,在社交平台出售手搓应用,单个成交量可达数百至上千单,不受赛道限制,发展成一门新生意。
中美大模型差距缩小至3-6个月,国产模型正从参数竞赛转向效率优化与多模态融合。行业呈现战略分化:智谱AI专注国产化全栈ToB服务,打造产业AI底座;MiniMax则凭借高营收增速,通过AI原生内容平台布局全球化ToC市场。
微软升级必应视频创作者,接入OpenAI最新Sora 2模型,显著提升视频生成质量,画面更逼真、动作更流畅,且继续免费向所有用户开放。
乐奇AI眼镜海外版升级,支持谷歌Gemini模型,成为全球首个兼容该模型的眼镜产品。至此,已集成Gemini、ChatGPT、DeepSeek和通义千问四大主流AI模型,打破技术壁垒,实现多模型“同台竞技”,提升用户体验。