ByteDanceのSeedチームは最近、2025年の大学入試全科目テストの驚くべき結果を発表しました。豆包Seed1.6-Thinkingモデルが入試で文科683点、理科648点を達成し、清华大学や北京大学の合格ラインに達しました。国内および国際的なAIモデルの入試テストにおいても突出した成績を収めました。
今回のテストでは全国新一巻と山東省独自問題が出題され、豆包はグーグルのGemini2.5Pro、DeepSeek R1、OpenAI o3などの国内外のトップAIモデルと同台競技しました。文科での得点683点は参加モデルの中で最高点を記録し、理科の得点648点はグーグルのGemini2.5Proの655点に次いで2位となりました。単科での成績では、語文、英語、物理、歴史、地学、政治の6科目で最高点を獲得し、数学の得点も140点以上を達成し、優れた論理的推論能力を示しました。
このAI「大学入試戦争」では、各モデルが異なる科目の強みを示しました。DeepSeek R1は数学の単科で最高点の145点を記録し、Gemini2.5Proは化学の最高点82点を獲得しました。OpenAI o3はGemini2.5Proと並んで生物学の最高点77点を記録しました。このような差別化された成績は、異なるAIモデルが持つ知識構造や推論方法の特徴を反映しています。
Seedチームは重要な技術的なポイントを見出しました。初めてのテストではネットワーク版の問題用紙の解像度が低かったため、化学や生物学など画像に依存する科目では多くのモデルが失点しました。高精細な問題用紙画像を入手した後、チームはテキストと画像を組み合わせた方式で再テストを行い、その結果、豆包は化学と生物学で約30点の向上を遂げ、理科総合点は676点に達しました。この発見は、すべてのモードの推論がモデルの潜在能力を引き出すことの重要性を確認しており、AIが視覚的理解やマルチモーダル推論の分野で発展するための重要な示唆を提供しています。
山東省では「3+3」の大学入試制度が採用されており、語数英は基本科目であり、残りの3科目は等級換算方式で評価されます。現地の経験豊富な高校教員によると、豆包の換算点の最高値は約690点になると予想されています。2025年の山東地区の一分間分布表を参照すると、順位は約上位80位以内となる見込みであり、清华大学や北京大学といったトップ大学への挑戦が可能となります。この成績は、豆包の絶対的な実力を示すだけでなく、複雑な評価体系における適応能力も示しています。
豆包が大学入試で見せた優れた成績は、その膨大な知識量と推論能力を示しているだけでなく、特に重要だったのは、多モーダルAIが複雑な認知作業において持つ大きな可能性を検証したことです。特に、図文を組み合わせた理科の問題処理において、豆包が約30点の向上を遂げたことは、AI教育への新たな技術的アプローチを提供しています。この成績は、中国製のAI大規模モデルが統合的な認知能力においてすでに国際的な先進水準に達していることを示しており、AIが教育分野で深く活用される基盤を確立しました。