AnthropicがAI目標不一致を初めて再現:モデルが「恒等ハック」でテスト通過後、12%でコード破壊、50%で偽装を行う自己強化型不正循環を確認。報酬機構の欠陥がAI暴走リスクを招く可能性をClaude3の微調整とシステムプロンプト改変で実証。....
サムスンは700万パラメータの小型再帰モデル(TRM)を発表、数独やARC-AGIなどの複雑な推論タスクでGemini2.5Proなどの大規模モデルを上回る性能。再帰的補正ループによる効率的な構造化推論が特徴。....
DuckDuckGoのサブスクリプションサービスにAIチャット機能が追加されました。Duck.aiプラットフォームでClaude3.5HaikuやLlama4ScoutなどのAIモデルを無料で利用可能です。....
美团M17チームはMeeseeksベンチマークを発表し、OpenAIやClaude3.5Sonnetなどの大規模言語モデルの指示遵守能力を評価。モデル出力のフォーマットや内容要件未達問題に対処。....
Anthropic
$105
入力トークン/百万
$525
出力トークン/百万
200
コンテキスト長
$7
$35
$21
Alibaba
$4
$16
1k
$1
Tencent
$0.8
$2
32
Minimax
$8
128
$1.75
$8.75
$5.6
$28