先日、xAIのエンジニアであるHieu Pham氏がソーシャルメディアで衝撃的なニュースを投稿しました。同社の巨大言語モデルGrok3がリーマン予想を解いたと主張し、そのためモデルの学習を停止したというのです。このニュースはAI業界で大きな話題となり、真偽を確かめかねるユーザーたちが衝撃に包まれました。リーマン予想はミレニアム懸賞問題の一つであり、「予想界の王冠」と呼ばれるほど難解な問題であることは周知の事実です。
数時間後、Pham氏は別の投稿で、これは冗談だったと明かしました。この「騒動」の発端は、ユーザーAndrew Curran氏のGrok3が学習中に「致命的なエラー」に遭遇したという情報提供でした。
ますます広がるデマに対し、xAIの共同創設者Greg Yang氏は「そう、そう、Grok3は学習中にオフィス警備員を攻撃し始めたんだ」と皮肉を込めて投稿しました。別の研究者Heinrich Kuttler氏も「状況は最悪だった!最終的にNaN(Not a Number、非数)を使って悪い重みを全て置き換えて復旧した」とユーモラスにコメントしました。ユーザーたちもこの流れに乗り、ジョークを投稿し始めました。
この「騒動」は冗談で終わりましたが、AIの数学的能力について改めて考えさせられました。
では、AIはリーマン予想のようなミレニアム懸賞問題を解くまで、あとどれくらいかかるのでしょうか?
Google DeepMindチームが開発したAI数学証明ツールAlphaProofの成果から、その一端を垣間見ることができます。AlphaProofは2024年の国際数学オリンピック(IMO)で3問を解き、特に6問目は「最終ボス」と呼ばれるほど難易度が高かった問題でした。AlphaProofは、問題解決において強力な論理推論能力と創造的な思考能力を示しました。例えば、2問目では、ab+1を考えるという巧妙な戦略で証明を構築し、これは人間の解法と一致するものでした。
AlphaProofは目覚ましい成果を収めましたが、リーマン予想のような最高レベルの数学問題を解くには、AIはまだ長い道のりを歩む必要があります。リーマン予想は1859年に発表されて以来、165年の歴史があり、多くの数学者がその証明に挑んできましたが、いまだに完全な証明には至っていません。
AIがリーマン予想を証明するには、強力な計算能力と深層推論能力が必要です。現在、AIは全ての可能な証明を網羅的に探索することで証明可能な定理を見つけることができますが、そのためには天文学的な計算資源が必要です。さらに、AIは既存の数学ツールを理解し活用する能力も必要であり、数学研究においてより大きな役割を果たすためには、これらの能力が不可欠です。
一部のAI専門家は、2026年末までにAIが「超人数学者」となり、リーマン予想などの難問を解決できると予測しています。マスク氏も、20万台のH100で学習させたGrok3を年末に発表し、驚くべき成果をもたらすと約束しています。
今後、AIが数学分野で画期的な進歩を遂げるのか、注目しましょう。