情報

AIニュース

AIの最先端を探索、業界トレンドを完全マスター

AIニュース日報

毎日更新！AIホットトピックス＆業界最前線

情報

AIツールを探す

精確な製品選定＆多角的市場調査

AI製品ランキング

話題のAI製品総合力＆バズ度ランキング（年間/月間/デイリー）

AIプロダクト登録

AI製品を登録して、認知度アップ＆ユーザー獲得を加速！

ツール

AIツールディレクトリ

AIツール総合ナビ！あなたにピッタリのツールが見つかる

情報

AIモデルファインダー

全種類AIモデル完備！開発から研究まで、あなたのニーズを完全サポート

LLMランキング

人気AI大規模モデル性能・注目度・年/月/日ランキング

LLMプロバイダー

信頼できるAIモデルパートナーを見つけよう！安心のサポート体制

AIモデル登録

AIモデル・サービスを登録して、ターゲットユーザーに確実にリーチ！

ツール

LLM比較選定

AI大規模モデル徹底比較！あなたにピッタリのモデルが見つかる

LLMコスト計算機

AIモデルのコストを正確に把握！スマートな予算計画で無駄を削減

LLMアリーナ

マルチモデルリアルタイム評価、モデル出力結果迅速比較

情報

MCPサーバー

人気AI-MCPサービスを集約、あなたに適したサービスを迅速発見

MCPクライアント

MCPクライアントに簡単接続、強力なAI機能を呼び出し

MCPケースチュートリアル

MCP使用テクニックを学習、入門から上級まで

MCPランキング

人気MCPサービス性能ランキング、最適選択をサポート

MCPサービス提出

あなたのMCPサービスを公開・プロモーション

ツール

MCP実験場

MCPサービスを自由にテスト、オンラインで迅速体験

MCPインスペクター

MCPサービス迅速テスト、迅速リリース

GEO順位最適化サービス

GEOサービスにより、御社の企業やブランドのAI検索における支配的な表示を実現

GEOランキング照会ツール

AIプラットフォーム上のブランド認知度を測定する

ツール

AIモデル互換性チェッカー

PC環境でDeepSeek・Llamaが動作するか無料診断

情報

AIデータセット

モデルの訓練・評価・テスト用大規模データセット・ベンチマーク

ツール

インテリジェント文書認識

ユーザーに各種文書のテキスト抽出・文書処理を提供、汎用・カスタムシーン対応の多様な文書処理をサポート

AIチュートリアル

大学入学共通テスト数学大会：6つのAIモデルが競う、豆包と元宝が同時優勝

AIbase基地

公開日AIニュース · 1 分で読めます · Jun 9, 2025

大学入学試験（高考）が近づくにつれ、数学の試験は再び受験生たちにとって「魔物」になりました。この熾烈な競争の中で、6つの主要な人工知能モデルも挑戦に参加しました。それらは、字節跳動の「豆包」、テンセントの「元宝」、アリクラウドの「通義」、百度の「文心 X1Turbo」、深層求索の「DeepSeek」、そしてOpenAIの「o3」です。今回のテストでは、2025年新課程基準Ⅰ巻の14問の客観問題を使用し、合計得点は73点で、単選題、複選題、および穴埋め問題が含まれています。

公平性を確保するために、すべてのモデルはシステムのヒントやインターネット検索を利用することはできず、それぞれが一度だけ解答するという制約がありました。厳しい競争の末、結果は予想外でした。「豆包」と「元宝」がそれぞれ68点で並んでトップとなり、優れた推論能力を見せつけました。「DeepSeek」と「通義」はやや劣勢で、それぞれ63点と62点で終了しました。「文心 X1」と「o3」は残念ながら期待外れで、特に「o3」はわずか34点しか獲得せず、国内の高校入試問題への適応力の欠如が明らかになりました。

具体的な問題形式でのパフォーマンスを見ると、「豆包」「通義」「元宝」が単選題でそれぞれ35点を取り、輝かしい成果を収めました。「DeepSeek」は2問ミスをして30点、「o3」は滑り止めの結果となり、単選題ではわずか20点に留まりました。複選題では、「豆包」「DeepSeek」「元宝」が完璧なパフォーマンスを発揮し、3問とも正解を出し、高い安定性を見せました。「通義」は速さこそ見せましたが、重要な局面での判断ミスにより、結果的に不十分な点数に終わっています。

今回のテストは、各AIモデルの高校入試数学に対する潜在力と弱点を示すだけでなく、推論能力や反省能力の進化を反映しています。昨年と比較して、これらのモデルは細部の処理、公式の適用、論理的な推論において顕著な改善が見られました。それでもまだいくつかの誤りや課題がありますが、今回の競技は未来のAI数学能力の基礎を築く上で重要な役割を果たしました。

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成