xAIがGrok4.20を発表:推論性能が大幅に向上 不確定性率78%で業界記録を樹立
2026年3月12日、xAIは新世代の大規模言語モデルGrok4.20 Betaを発表しました。このモデルは価格の競争力がある一方で、非常に高い事実の信頼性により業界記録を達成しました。推論機能を有効化したインテリジェンス指数評価では、Grok4.20は48点を獲得し、前バージョンより6点上昇しました。ただし、総合ベンチマークスコア(57点)はGemini3.1Pro PreviewやGPT-5.4に少し劣るものの、AA全知テストでは優れた成績を収め、非幻覚率が78%に達しました。