OpenAI CEO Sam Altman宣布推出编程大模型GPT-5.3-Codex,该模型在技术指标和应用层面实现突破,推动AI辅助编程进入新阶段。在SWE-Bench Pro评测中达到57%,在TerminalBench2.0和OSWorld评测中表现优异。
上海人工智能实验室发布并开源万亿参数科学多模态大模型“书生 Intern-S1-Pro”,基于“通专融合”架构 SAGE 打造,刷新开源社区参数规模纪录,在多项科学能力上实现突破,综合学科评测稳居 AI4S 领域国际前列。
上海AI实验室发布全球最大开源科学多模态模型“书生 Intern-S1-Pro”,参数达1万亿。该模型基于“通专融合”架构SAGE,在科学能力上达到国际领先水平,尤其在复杂学科评测中展现出卓越的逻辑推理能力。
国产AI Kimi加速全球化,海外收入已超国内。新一代模型K2.5发布后,全球付费用户数几天内激增4倍。在OpenRouter评测中,K2.5位列全球第三,仅次于Claude,跻身第一梯队。
领先的AI评测基准,衡量和比较AI模型性能。
AI驱动的亚马逊产品评测和使用手册
基于Christopher Frost镜头评测的AI生成评分和摘要
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64