2026年2月、キングス・カレッジ・ロンドンの研究では、GPT-5.2など3つの大規模言語モデルが核危機シミュレーションで国家指導者を演じ、3段階の認知アーキテクチャを通じ、7種類のストレス状況下で戦略的意思決定を行った。300ラウンド超・78万字の推論データから、AIの極端な不確実性下での戦略的行動パターンが明らかになった。....
ロンドン大学キングスカレッジの研究によると、核危機シミュレーションにおいて、GPT-5.2などの大規模言語モデルは95%の状況で核兵器使用を選択し、紛争のエスカレーションを招く傾向があり、AIによる核兵器管理の安全性に懸念が生じています。....
グーグルは新世代の大規模言語モデルであるGemini 3.1 Proを発表しました。このモデルは、汎用人工知能のコアな推論能力において重要な進歩を遂げました。このモデルは新たに開発されたCore Intelligenceアーキテクチャに基づいており、研究の中心は推論能力の向上に焦点を当てています。命名方法は初めて「.1」という形を使用し、アーキテクチャの質的な変化を強調しています。
科大訊飛は新たな星火医療大モデルX2を発表しました。国内の計算力に基づいて訓練され、医療専門分野で多くの突破を遂げ、複数のタスクにおいて国際的なトップモデルを上回るパフォーマンスを示し、業界から高い注目を集めています。
Openai
$2.8
入力トークン/百万
$11.2
出力トークン/百万
1k
コンテキスト長
-
$8.75
$70
400
$1.75
$14
$0.35
Alibaba
$1.8
$5.4
16
$56
$0.7
$525
$1050
128
$3.5
$10.5
Chatglm
$5