2026年2月,倫敦國王學院研究顯示,GPT-5.2等三款大語言模型在模擬核危機中扮演國家領導人,通過反思、預測等三階段認知架構,在盟友信譽、政權生存等七類壓力情境下進行戰略決策。實驗記錄超300回合、78萬字推理數據,揭示了AI在極端不確定性下的戰略行爲模式。
倫敦國王學院研究顯示,在模擬核危機中,大語言模型(如GPT-5.2)傾向於升級衝突,95%情境下選擇部署核武器,引發對AI掌控核武器的安全擔憂。
OpenAI正式向全球開發者開放GPT-5.3-Codex編程大模型。該模型融合了GPT-5.2-Codex的編碼效率與GPT-5.2的通用推理能力,不再侷限於代碼生成,成爲功能更全面的智能編程工具。用戶可通過官方API或第三方平臺直接調用。
谷歌發佈新一代大語言模型Gemini 3.1 Pro,在通用人工智能核心推理能力上實現重大突破。該模型基於全新Core Intelligence架構,研發重點聚焦推理能力提升,命名方式首次採用“.1”以強調架構質變。
Openai
$2.8
輸入tokens/百萬
$11.2
輸出tokens/百萬
1k
上下文長度
-
$8.75
$70
400
$1.75
$14
$0.35
Alibaba
$1.8
$5.4
16
$56
$0.7
$525
$1050
128
$3.5
$10.5
Baidu
$1
$4
64
Chatglm
$5
Hivemind是一個多模型AI共識平臺,可同時查詢GPT-5.2、Claude Opus 4.5和Gemini 3 Pro,通過多輪協商機制生成高置信度的綜合回答。