大模型竞争格局再度洗牌。根据最新发布的 Artificial Analysis 智能指数,Anthropic 的旗舰模型Claude Opus4.6凭借卓越的表现力压群雄,正式登顶该权威排行榜。这一指数综合了编程、代理任务和科学推理等十项深度测试,Opus4.6在代理类工作任务、终端编程以及物理研究课题上均斩获第一

image.png

值得关注的是,尽管 Opus4.6的运行成本高达2,486美元,略高于 OpenAIGPT-5.2的2,304美元,但在效率表现上却呈现出显著差异。数据显示,Opus4.6在测试过程中消耗了约5,800万个输出 Token,虽然这一数字是前代机型4.5的两倍,但相较于 GPT-5.2惊人的1.3亿个 Token,Opus4.6显然在信息密度和处理逻辑上更为精简。目前,该模型已全面上线Claude.ai平台,并支持通过 Google Vertex、AWS Bedrock 等主流云服务进行调用。

然而,Anthropic 的领先地位正面临严峻挑战。行业巨头 OpenAI 的新一代编程利器Codex5.3已在备测名单中。分析人士指出,一旦 Codex5.3完成所有基准测试,其在代码编写及相关逻辑领域的优势极有可能助其重夺王座。这场“全球最聪明模型”的拉锯战,远未到盖棺论定的时候。