AIBase
ホーム
AIニュース
AIツール
AIモデル
MCP
AIサービス
AI計算力
AIチュートリアル
AIデータセット
JA

AIニュース

もっと見る

リーディングAIモデルは複雑な物理的なタスクでは効果が劣る 人間の支援が必要

世界50人以上の物理学者が開発した「CritPt」ベンチマークでAIを評価。未公開の複雑な物理問題への対応力を博士課程レベルでテストしたが、Gemini3Proの正解率は9.1%に留まり、AIの科学研究における限界が浮き彫りに。....

4.3k 5 分前
リーディングAIモデルは複雑な物理的なタスクでは効果が劣る 人間の支援が必要

AIはノーベル賞からどのくらい遠いのか?最高レベルのモデルが博士課程レベルの物理学ベンチマークテストCritPtで惨敗、正確度は10%未満

最新物理ベンチマーク「CritPt」によると、Gemini3ProやGPT-5などの最先端AIモデルは自律的科学者になるには依然として大きな隔たりがある。50人以上の物理学者が開発したこのテストは、知識記憶ではなく博士レベルの実践的研究能力を評価し、AIの創造的研究における限界を浮き彫りにした。....

5.7k 5 分前
AIはノーベル賞からどのくらい遠いのか?最高レベルのモデルが博士課程レベルの物理学ベンチマークテストCritPtで惨敗、正確度は10%未満
AIBase
未来を力づける、あなたの人工知能ソリューションシンクタンク
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
ビジネス協力サイトマップ