人工知能の急速な発展の中で、Metaとカリフォルニア大学サンディエゴ校(UCSD)は「DeepConf」という革新技術を共同で開発しました。この新技術は、難易度の高い推論問題における正確性と計算コストにおいて画期的な進展を遂げ、業界の注目を集めています。

image.png

DeepConfは、人工知能分野で長年課題とされてきた核心的な問題、つまり複雑な推論を行う際に高精度を保ちつつ、計算リソースの消費を抑える方法を解決しました。この技術は特にAIME2025数学コンテストでのパフォーマンスが注目され、オープンソースのGPT-OSS-120Bモデルと組み合わせることで、99.9%の正確率を達成し、計算リソースの使用量を84.7%も削減しました。

従来の推論方法は、多くの異なる解法を生成して投票によって最適な答えを選ぶことを依存していました。しかし、この方法は正確性と計算コストの面で大きな課題を抱えていました。MetaとUCSDの研究チームは、過多な解法のパスが収益の減少をもたらすだけでなく、低品質な答えが最終結果に悪影響を与える可能性があると指摘しています。また、従来の方法は大量の計算リソースを必要とするため、経済的に実現可能ではありません。

image.png

DeepConfは「信頼度」メカニズムを導入することで、従来の推論モードを変革しました。AIは問題を解く過程で各ステップの信頼度を評価し、あるステップで信頼度が不足している場合、すぐに停止して解法戦略を調整します。この柔軟な動的調整メカニズムにより、最終的な結果の正確性が向上するとともに、計算リソースの効果的な節約が可能です。

AIMEなどのトップクラスの数学コンテストでは、DeepConfの性能がその有効性を証明しています。従来の方法と比較して、DeepConfの組み合わせは正確性が顕著に向上し、生成されるトークン数が84.7%も減少しています。これは、優れた成績を収める一方で、DeepConfが計算センターにとってエネルギー消費を大幅に削減できることを示しており、人工知能推論分野における潜在力と革新性を示しています。

DeepConfのリリースにより、人工知能の推論能力には新たな発展の機会が訪れます。今後、AIが複雑なタスクにおける応用の可能性はさらに広がるでしょう。

論文:https://arxiv.org/abs/2508.15260

ポイント:  

🔍 DeepConf技術は、高難度の推論タスクにおいて99.9%の正確率を達成しました。

💡 計算リソースの消費量が84.7%減少し、計算コストが大幅に低下しました。

🚀 「信頼度」メカニズムにより、AIは動的に解法戦略を調整し、推論効率を向上させます。