OpenAI 发布 GPT-5.4系列:百万级上下文窗口，Pro 与 Thinking 版同步登场

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Mar 6, 2026

222

OpenAI正式发布全新基础模型GPT-5.4，旨在打造目前功能最强且效率最高的专业工作前沿模型。据 AIbase 报道，该系列此次采取了差异化发布策略，除标准版外，同步推出专注于复杂逻辑的推理模型 GPT-5.4Thinking，以及针对高性能需求优化的 GPT-5.4Pro。

ChatGPT

技术层面，GPT-5.4的 API 版本实现了飞跃，提供高达 100万个标记（Tokens）的上下文窗口，为 OpenAI 史上之最。与此同时，该模型显著提升了令牌效率，能以更少的资源消耗解决同类问题。

在安全性与准确性上，新模型较 GPT-5.2的单个陈述错误率降低了33%，整体回复错误率下降18%。此外，针对推理模型可能存在的“思维链欺骗”风险，OpenAI引入了全新的安全评估系统，测试表明GPT-5.4Thinking具备更高的透明度，难以隐藏或伪造其推理过程。

在实测基准测试中，GPT-5.4表现强劲，不仅在 OSWorld-Verified 和 WebArena Verified 等计算机使用测试中刷新纪录，更在知识工作任务 GDPval 测试中取得83% 的创纪录高分。

Mercor 首席执行官 Brendan Foody 指出，该模型在金融、法律等专业领域的APEX-Agents基准测试中同样处于领先地位，尤其擅长生成财务模型、法律分析等长期交付成果。配合全新的“工具搜索”系统，模型在调用外部工具时更具效率，大幅降低了大规模工具集成下的令牌损耗。

警惕“AI 蒸馏”：Meta 封杀竞品编码工具，大模型行业护城河博弈升级

Meta被曝禁止工程师使用Anthropic的Claude Code和OpenAI的Codex，此举揭开AI企业间“模型蒸馏”博弈序幕。蒸馏指利用强模型输出训练新模型，Meta的核心忧虑是防范对手通过员工使用竞品工具，间接获取数据或知识以复制优化自身模型。

SpaceX展示纤薄AI设备原型，深度整合xAI技术并对标OpenAI

SpaceX展示了一款类似手机的AI设备原型，比iPhone更纤薄，介乎触屏手机与Rabbit R1之间，引发其进军消费电子和移动业务的猜测。尽管马斯克公开否认报道“纯属捏造”，但此举仍被视为释放拓展信号，项目处于早期，设计或调整。

AI新闻资讯

最新AI日报

AI 商用·开源产品库

AI 产品排行榜

AI产品提交

AI工具导航

GEO 品牌全景分析

GEO 品牌得分检测

GEO 排名查询

GEO 排名监测

AI 对话问题挖掘

GEO 推广链接检测

站点AI友好度检测

GEO排名优化系统源码

GEO 排名优化服务

MCP服务端

MCP客户端

MCP教程与实践

MCP排行榜

MCP服务提交

MCP实验场

MCP服务调试器

大模型API聚合平台

模型库

模型供应商

大模型排行榜

大模型API中转站检测

大模型选型对比

大模型费用计算器

大模型竞技场

模型个人电脑配置检测器

模型部署服务器配置计算器

OpenAI 发布 GPT-5.4系列:百万级上下文窗口，Pro 与 Thinking 版同步登场

AIbase基地

本文来自AIbase日报

相关AI新闻推荐

AI 互动酿成悲剧：用户起诉 OpenAI，称 ChatGPT 加剧其心理病情

警惕“AI 蒸馏”：Meta 封杀竞品编码工具，大模型行业护城河博弈升级

美团大模型生态调整：全面限用豆包，力推自研 LongCat 体系

历时18个月研发，葡萄牙国家级大模型“阿马利娅”正式亮相

气象探测新利器：纳睿雷达发布“睿宸”AI 气象大模型及相控阵雷达

谷歌全面扩容 Gemini API 免费额度：部分模型单分钟吞吐量翻至百万级

国产大模型再迎“重磅炸弹”：Kimi K3 或于本月发布，参数规模直指 2.5 万亿

孙天祥入职百度出任基础模型研发部负责人，并进入模型委员会

SpaceX展示纤薄AI设备原型，深度整合xAI技术并对标OpenAI

OpenAI 发布 GeneBench-Pro 基准测试，提升 AI 模型生物学分析能力！

相关AI新闻推荐

AI 互动酿成悲剧：用户起诉 OpenAI，称 ChatGPT 加剧其心理病情

警惕“AI 蒸馏”：Meta 封杀竞品编码工具，大模型行业护城河博弈升级

美团大模型生态调整：全面限用豆包，力推自研 LongCat 体系

历时18个月研发，葡萄牙国家级大模型“阿马利娅”正式亮相

气象探测新利器：纳睿雷达发布“睿宸”AI 气象大模型及相控阵雷达

谷歌全面扩容 Gemini API 免费额度：部分模型单分钟吞吐量翻至百万级

国产大模型再迎“重磅炸弹”：Kimi K3 或于本月发布，参数规模直指 2.5 万亿

孙天祥入职百度出任基础模型研发部负责人，并进入模型委员会

SpaceX展示纤薄AI设备原型，深度整合xAI技术并对标OpenAI

OpenAI 发布 GeneBench-Pro 基准测试，提升 AI 模型生物学分析能力！