性能にはこだわらず、人品を重視：xAIがGrok 4.20の幻覚率を業界最低に

AIbase基地

公開日AIニュース · 1 分で読めます · Mar 13, 2026

AIの巨頭たちが激しくパラメータを増やし、スコア競争に熱中する中、マスクが率いるxAIは異彩を放ち、AI業界で最も悩ましい「真面目な間違い」の問題に取り組もうとしている。今日、xAIは正式にGrok4.20Betaをリリースした。絶対的な知能スコアではまだトップクラスのモデルと差があるものの、「誠実さ」という重要な指標においては業界記録を更新した。

Artificial Analysisによる最新評価によると、Grok4.20の推論モードでの知能指数は48点だったが、と（両者とも57点）には及ばなかったものの、事実の信頼性におけるパフォーマンスは非常に驚くべきものだった：

最低の幻覚率: AA Omniscienceテストにおいて、Grok4.20は78%の「幻覚なし率」を達成し、歴史的な新記録を樹立した。
知ることは知る: このモデルは答えられない質問に直面したとき、以前のように架空の事実を捏造する傾向が少なくなり、より正確に「分からない」と認めることができるようになった。この「誠実さ」は厳格なオフィスや研究環境において非常に重要である。

技術構造：三位一体のAPIマトリクス

異なるニーズに対応するために、xAIは今回のリリースで3種類のAPIバリアントを提供している：

推論モード（Reasoning）: 速度を犠牲にして深く論理的思考を行う。これは幻覚記録を破った主要な要因である。

標準モード（Non-reasoning）: 速い応答と通常のインタラクションを重視する。

マルチエージェントモード（Multi-agent）: 複雑なタスクを複数のAIインスタンスが協力して処理できる。

市場戦略：量を増やして値段を上げない

Grok4.20は性能だけでなく、ビジネス上のロジックにも攻撃性がある：

膨大なコンテキスト: 最大で200万トークンのコンテキストウィンドウをサポートしており、一括りに本や大量のコードベースを読み込むことができる。
価格の優位性: 100万トークンあたり2～6ドルの価格設定となっており、前世代のGrok4よりも安価であり、現在の西洋主要モデルの中でも非常に競争力がある。

Grok4.20のリリースは、xAIの戦略の転換を示している。AGIへの道で総合スコアを追求するのではなく、「企業向けの信頼性」という痛所に焦点を当てている。評価機関が述べたように、他のモデルが「全能の預言者」になることを目指す一方で、Grok4.20は「嘘をつかないアシスタント」になることを目指している。

データの正確性に高い要求を持つユーザーにとって、Grok4.20はOpenAIやグーグルに次ぐ第三の重鎮的な選択肢となる可能性がある。

AI新語 xAI Grok4.20Beta 誠実度

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

未来を予見する！グーグルDeepMindのCEOがAGIは3年以内に到来すると語る

グーグルDeepMindのCEOであるハサビスは、汎用人工知能（AGI）が2029年から2030年にかけて最も早い可能性があると予測した。重要な技術的突破は今後3年以内に実現されるかもしれない。彼は、テクノロジー企業がこれらのコア技術であるマルチモーダル理解、自律的な意思決定、AIエージェントなどの分野に投資を増やしていることで、技術が急速に成熟していると指摘した。

May 29, 2026

ロボットがフレーム単位の動作学習から離れる！世界初のイベントレベルの embodied AI 世界モデルを発表

変数ロボットチームは、世界初の「イベントレベル予測」に基づく embodied AI 世界モデル WALL-WM を発表しました。従来の時間フレームに沿った学習の制約を突破し、予測単位を意味のあるイベントに切り替え、ロボットのタスク理解と実行能力を向上させ、業界の新たな段階を示しています。

May 29, 2026

3倍に急増！企業向けAI検索のユニコーン企業Glean、年収が3億ドルを突破

エンタープライズAI検索のスタートアップGleanは、年換算収益が3億ドルを突破。1億ドル達成からわずか15カ月で3倍に成長した。かつて「企業版Google」として競合がほぼいなかったが、現在はGoogle、Microsoft、OpenAIなどの大手と競合しながらも、強い勢いを維持している。....

May 29, 2026

AI日報：Claude Opus 4.8がリリース；小紅書のPC版にAI検索アシスタント「ドンドン」が登場；階躍星辰がStep 3.7 Flashの大モデルをオープンソース化

【AI日報】へようこそ！ここでは毎日、人工知能世界を探求するためのガイドとなります。毎日、AI分野のホットな内容をお届けし、開発者向けに焦点を当て、技術のトレンドを理解し、革新的なAI製品の応用を紹介します。新鮮なAI製品については、以下のリンクから詳細をご確認ください：https://app.aibase.com/zh1、GPT-5.5を超える！Hy-Memoryはさまざまなテストセットで優れた性能を示し、記憶密度と処理効率を顕著に向上させ、異なるニーズに対応する多様な構成を提供しています。

May 29, 2026

Oculusの創設者が再び起業！会話型AIの新鋭SesameがiOSアプリをリリース　考えながら話すことを特長とする

Sesameは、Oculusの創設者でありかつてVRの中心的なメンバーだった人物によって設立されたAI企業で、5月28日に会話型AIエージェントのiOSベータ版をリリースしました。これはChatGPTなどの従来のチャットボットの「質問と回答」のスタイルを打ち破り、独自開発技術により、AIの深い思考を維持しながらも、会話がスムーズで自然になるようにし、人間と機械のインタラクション体験を再定義しています。

May 29, 2026

100

OpenAIと提携！三菱UFJ金融グループが従業員全員のAI化転換を推進

三菱UFJ金融グループ（MUFG）は、約3万5千人の従業員にChatGPT Enterpriseを全面的に導入し、AIナイブ企業への深層的な転換を開始したことを発表した。2024年10月にOpenAIと提携して以来、このグループは生成的AIを利用して金融業務を再構築し、小売顧客体験を向上させ、人間の思考力と創造力を拡大することを目的としてきた。この取り組みは、同社がAI駆動型の業務新段階に入る重要な出来事であることを示している。

May 29, 2026

アリババクラウド百炼がすべてCLI化され、オープンソース化されました：1行のコマンドでAIエージェントの全スタック機能を編成

アリババクラウド百炼は2026年5月29日にすべてCLI化され、そのCLIプロジェクトをオープンソース化しました。この取り組みにより、AIエージェントへの接続と開発が全スタック一体化の変革をもたらしました。CLIは主要なモデル、ワークフロー、知識ベース、記憶管理、インターネット検索、マルチモーダルファイル処理などの核心的な能力を軽量なコマンドラインインターフェースにカプセル化し、開発者はインストールと認証後に効率的に利用できます。

May 29, 2026

史上最大のチップリース取引が誕生！アポロがブラックストーンと提携して360億ドルを資金調達し、アンソニープを激しく購入するグーグルTPU

世界中の人工知能インフラ構築に資本の熱狂が巻き起こっている。アポロ・グローバル・マネジメントとブラックストーングループは約360億ドルの債務融資を共同で計画し、AIスターチャンプであるアンソニープに資金を提供する予定である。これは過去最大級の私募クレジット取引の一つとなり、最高水準のAIインフラが加速的に実現されるだろう。

May 29, 2026

端末側大モデルに突破！Liquid AIが混合エキスパートモデルLFM2.5をオープンソース化

人工知能スタートアップのLiquid AIは、端末側大モデルであるLFM2.5-8B-A1Bを発表し、オープンソース化しました。これは、コンシューマー向けハードウェアに特化したモデルで、ツール呼び出しや指示の遵守能力を最適化しています。このモデルは疎な混合エキスパート構造を採用しており、総パラメータ数は83億ですが、各トークンごとに15億のパラメータのみがアクティブになります。これにより計算コストを抑えつつ推論性能を向上させ、スマートフォンやノートPCでもスムーズに動作できます。

May 29, 2026

テクノロジー業界の変化：MiniMaxの企業顧客が100万を突破、創想3Dが香港証券取引所に上場

最近、テクノロジー業界で注目されている2つのホットな話題：AIアプリケーション会社MiniMaxは強力なパフォーマンスを見せ、世界中の企業および開発者顧客数が100万を超えた。半年間で5倍に増加し、ユーザー数は3億人に達した。一方、3Dプリンティング企業の創想3Dが上場し、これにより消費者向け3Dプリンティングが一般化の段階に入ったことを示している。

May 29, 2026

AIニュース

AIニュース日報

AIツールを探す

AI製品ランキング

AIプロダクト登録

AIツールディレクトリ

GEO ブランドビジビリティ

GEOブランドAI可視性診断

GEOランキング照会ツール

GEO順位モニタリングツール

AI対話キーワード発掘

GEOプロモーションリンク検出

GEOランキング最適化システム

GEO順位最適化サービス

MCPサーバー

MCPクライアント

MCPケースチュートリアル

MCPランキング

MCPサービス提出

MCP実験場

MCPインスペクター

大規模言語モデルAPI

AIモデルファインダー

LLMプロバイダー

LLMランキング

LLM比較選定

LLMコスト計算機

LLMアリーナ

AIモデル互換性チェッカー

モデル展開サーバー構成計算機

​性能にはこだわらず、人品を重視：xAIがGrok 4.20の幻覚率を業界最低に

AIbase基地

技術構造：三位一体のAPIマトリクス

市場戦略：量を増やして値段を上げない

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

未来を予見する！グーグルDeepMindのCEOがAGIは3年以内に到来すると語る

ロボットがフレーム単位の動作学習から離れる！世界初のイベントレベルの embodied AI 世界モデルを発表

3倍に急増！企業向けAI検索のユニコーン企業Glean、年収が3億ドルを突破

AI日報：Claude Opus 4.8がリリース；小紅書のPC版にAI検索アシスタント「ドンドン」が登場；階躍星辰がStep 3.7 Flashの大モデルをオープンソース化

Oculusの創設者が再び起業！会話型AIの新鋭SesameがiOSアプリをリリース 考えながら話すことを特長とする

OpenAIと提携！三菱UFJ金融グループが従業員全員のAI化転換を推進

アリババクラウド百炼がすべてCLI化され、オープンソース化されました：1行のコマンドでAIエージェントの全スタック機能を編成

史上最大のチップリース取引が誕生！アポロがブラックストーンと提携して360億ドルを資金調達し、アンソニープを激しく購入するグーグルTPU

端末側大モデルに突破！Liquid AIが混合エキスパートモデルLFM2.5をオープンソース化

テクノロジー業界の変化：MiniMaxの企業顧客が100万を突破、創想3Dが香港証券取引所に上場

関連AIニュースの推奨

未来を予見する！グーグルDeepMindのCEOがAGIは3年以内に到来すると語る

ロボットがフレーム単位の動作学習から離れる！世界初のイベントレベルの embodied AI 世界モデルを発表

3倍に急増！企業向けAI検索のユニコーン企業Glean、年収が3億ドルを突破

AI日報：Claude Opus 4.8がリリース；小紅書のPC版にAI検索アシスタント「ドンドン」が登場；階躍星辰がStep 3.7 Flashの大モデルをオープンソース化

Oculusの創設者が再び起業！会話型AIの新鋭SesameがiOSアプリをリリース 考えながら話すことを特長とする

OpenAIと提携！三菱UFJ金融グループが従業員全員のAI化転換を推進

アリババクラウド百炼がすべてCLI化され、オープンソース化されました：1行のコマンドでAIエージェントの全スタック機能を編成

史上最大のチップリース取引が誕生！アポロがブラックストーンと提携して360億ドルを資金調達し、アンソニープを激しく購入するグーグルTPU

端末側大モデルに突破！Liquid AIが混合エキスパートモデルLFM2.5をオープンソース化

テクノロジー業界の変化：MiniMaxの企業顧客が100万を突破、創想3Dが香港証券取引所に上場

性能にはこだわらず、人品を重視：xAIがGrok 4.20の幻覚率を業界最低に

Oculusの創設者が再び起業！会話型AIの新鋭SesameがiOSアプリをリリース　考えながら話すことを特長とする

Oculusの創設者が再び起業！会話型AIの新鋭SesameがiOSアプリをリリース　考えながら話すことを特長とする