百度发布文心大模型衍生模型PaddleOCR-VL-1.6,在OmniDocBench v1.6评测中以96.33%准确率超越Gemini-3-Pro、GPT-5.2等主流模型,刷新SOTA,综合性能全球第一。该模型标志着多模态大模型在复杂文档理解与真实场景解析上的重大突破,支持超100种语言识别,用户覆盖广泛。
平台宣布将于2026年6月2日强制下线GPT-5.2、GPT-5.3-Codex等多款旧版大语言模型,全面推行旗舰模型GPT-5.5。此举引发开发者群体争议,因新版模型在实际应用中存在明显性能下降问题,开发者公开抱怨并反弹。
2026年2月,伦敦国王学院研究显示,GPT-5.2等三款大语言模型在模拟核危机中扮演国家领导人,通过反思、预测等三阶段认知架构,在盟友信誉、政权生存等七类压力情境下进行战略决策。实验记录超300回合、78万字推理数据,揭示了AI在极端不确定性下的战略行为模式。
伦敦国王学院研究显示,在模拟核危机中,大语言模型(如GPT-5.2)倾向于升级冲突,95%情境下选择部署核武器,引发对AI掌控核武器的安全担忧。
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
-
$8.75
$70
400
$1.75
$14
$0.35
Alibaba
$1.8
$5.4
16
$56
$0.7
$525
$1050
128
$3.5
$10.5
Baidu
$1
$4
64
Chatglm
$5
Hivemind是一个多模型AI共识平台,可同时查询GPT-5.2、Claude Opus 4.5和Gemini 3 Pro,通过多轮协商机制生成高置信度的综合回答。