情報

AIニュース

AIの最先端を探索、業界トレンドを完全マスター

AIニュース日報

毎日更新！AIホットトピックス＆業界最前線

情報

AIツールを探す

精確な製品選定＆多角的市場調査

AI製品ランキング

話題のAI製品総合力＆バズ度ランキング（年間/月間/デイリー）

AIプロダクト登録

AI製品を登録して、認知度アップ＆ユーザー獲得を加速！

ツール

AIツールディレクトリ

AIツール総合ナビ！あなたにピッタリのツールが見つかる

情報

AIモデルファインダー

全種類AIモデル完備！開発から研究まで、あなたのニーズを完全サポート

LLMランキング

人気AI大規模モデル性能・注目度・年/月/日ランキング

LLMプロバイダー

信頼できるAIモデルパートナーを見つけよう！安心のサポート体制

AIモデル登録

AIモデル・サービスを登録して、ターゲットユーザーに確実にリーチ！

ツール

LLM比較選定

AI大規模モデル徹底比較！あなたにピッタリのモデルが見つかる

LLMコスト計算機

AIモデルのコストを正確に把握！スマートな予算計画で無駄を削減

LLMアリーナ

マルチモデルリアルタイム評価、モデル出力結果迅速比較

情報

MCPサーバー

人気AI-MCPサービスを集約、あなたに適したサービスを迅速発見

MCPクライアント

MCPクライアントに簡単接続、強力なAI機能を呼び出し

MCPケースチュートリアル

MCP使用テクニックを学習、入門から上級まで

MCPランキング

人気MCPサービス性能ランキング、最適選択をサポート

MCPサービス提出

あなたのMCPサービスを公開・プロモーション

ツール

MCP実験場

MCPサービスを自由にテスト、オンラインで迅速体験

MCPインスペクター

MCPサービス迅速テスト、迅速リリース

GEO順位最適化サービス

GEOサービスにより、御社の企業やブランドのAI検索における支配的な表示を実現

GEOランキング照会ツール

AIプラットフォーム上のブランド認知度を測定する

ツール

AIモデル互換性チェッカー

PC環境でDeepSeek・Llamaが動作するか無料診断

情報

AIデータセット

モデルの訓練・評価・テスト用大規模データセット・ベンチマーク

ツール

インテリジェント文書認識

ユーザーに各種文書のテキスト抽出・文書処理を提供、汎用・カスタムシーン対応の多様な文書処理をサポート

AIチュートリアル

豆包AIの高考成績が清北の合格ラインに達した！文科683点で国内外トップモデルをリード

AIbase基地

公開日AIニュース · 1 分で読めます · Jun 26, 2025

ByteDanceのSeedチームは最近、2025年の大学入試全科目テストの驚くべき結果を発表しました。豆包Seed1.6-Thinkingモデルが入試で文科683点、理科648点を達成し、清华大学や北京大学の合格ラインに達しました。国内および国際的なAIモデルの入試テストにおいても突出した成績を収めました。

ByteDanceのDouyinの豆包大規模モデル

今回のテストでは全国新一巻と山東省独自問題が出題され、豆包はグーグルのGemini2.5Pro、DeepSeek R1、OpenAI o3などの国内外のトップAIモデルと同台競技しました。文科での得点683点は参加モデルの中で最高点を記録し、理科の得点648点はグーグルのGemini2.5Proの655点に次いで2位となりました。単科での成績では、語文、英語、物理、歴史、地学、政治の6科目で最高点を獲得し、数学の得点も140点以上を達成し、優れた論理的推論能力を示しました。

このAI「大学入試戦争」では、各モデルが異なる科目の強みを示しました。DeepSeek R1は数学の単科で最高点の145点を記録し、Gemini2.5Proは化学の最高点82点を獲得しました。OpenAI o3はGemini2.5Proと並んで生物学の最高点77点を記録しました。このような差別化された成績は、異なるAIモデルが持つ知識構造や推論方法の特徴を反映しています。

Seedチームは重要な技術的なポイントを見出しました。初めてのテストではネットワーク版の問題用紙の解像度が低かったため、化学や生物学など画像に依存する科目では多くのモデルが失点しました。高精細な問題用紙画像を入手した後、チームはテキストと画像を組み合わせた方式で再テストを行い、その結果、豆包は化学と生物学で約30点の向上を遂げ、理科総合点は676点に達しました。この発見は、すべてのモードの推論がモデルの潜在能力を引き出すことの重要性を確認しており、AIが視覚的理解やマルチモーダル推論の分野で発展するための重要な示唆を提供しています。

山東省では「3+3」の大学入試制度が採用されており、語数英は基本科目であり、残りの3科目は等級換算方式で評価されます。現地の経験豊富な高校教員によると、豆包の換算点の最高値は約690点になると予想されています。2025年の山東地区の一分間分布表を参照すると、順位は約上位80位以内となる見込みであり、清华大学や北京大学といったトップ大学への挑戦が可能となります。この成績は、豆包の絶対的な実力を示すだけでなく、複雑な評価体系における適応能力も示しています。

豆包が大学入試で見せた優れた成績は、その膨大な知識量と推論能力を示しているだけでなく、特に重要だったのは、多モーダルAIが複雑な認知作業において持つ大きな可能性を検証したことです。特に、図文を組み合わせた理科の問題処理において、豆包が約30点の向上を遂げたことは、AI教育への新たな技術的アプローチを提供しています。この成績は、中国製のAI大規模モデルが統合的な認知能力においてすでに国際的な先進水準に達していることを示しており、AIが教育分野で深く活用される基盤を確立しました。

AI新語ドゥーボ Seedチーム高考テスト

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

混沌世界モデル1.1が正式リリース：3D再構築技術を革新し、高品質なシーンを秒単位で生成

腾讯がオープンソースの混元世界モデル1.1を公開。多視点・動画入力に対応し、単一GPUで高速に3Dシーンを生成。一般ユーザーが専門ツールを簡単に利用可能に。....

Oct 22, 2025

最高のプロダクトマネージャーがAIメイクミラーを制作:宋紫薇はvivoを離れ起業し、ファッションAIハードウェア市場にターゲットを絞る

元vivoプロダクトマネージャー宋紫薇がAIハードウェアブランド「薇光点亮」を設立。AI化粧鏡分野に特化し、9月にエンジェルラウンドで中科创星と九合創投から資金調達。調達金はAIハードウェア開発、ソフトウェア開発、チーム強化に充て、技術革新と市場拡大を加速。....

Oct 22, 2025

科大訊飛 11 月 6 日に大きく発表：星火大モデルは全面的にアップグレード

科大訊飛は11月6日に合肥で1024開発者祭を開催。星火大モデルの最新アップデートを発表し、基盤能力の強化とマルチモーダル技術の進展を強調。オンライン企画は10月24日開始で、開発者の注目を集めている。....

Oct 22, 2025

サムスン Galaxy XR ヘッドセットが正式に登場：1799ドルから。Vision Proと性能を競い、軽量でエコシステムがオープン

サムスンが初のMRヘッドセットGalaxy XRを発売、価格は1799ドルでApple Vision Proの半額。デュアルMicro OLED搭載、総画素2900万、Android XRプラットフォーム採用で高コストパフォーマンスを実現。....

Oct 22, 2025

SEOは死んだ？85億ドルの生成型エンジン最適化市場が台頭し、ブランドの大手がAIマーケティングに参入

米国のホリデー買い物習慣は根本的な変化を遂げている。アドビの報告によると、2025年には小売業者がAIチャットボットや検索エンジンから得るトラフィックが520%急増する見込みで、消費者は従来の検索ではなく大規模言語モデルに商品を探す傾向にある。OpenAIはウォルマートと提携し、ユーザーがChatGPT内で直接買い物ができるようにし、AIショッピングの時代が加速していることを示している。

Oct 22, 2025

百川がイノベーティブな医療大規模モデル M2Plus をリリースし、医療の幻覚率を顕著に低減

百川大モデルが医療向け大規模モデル Baichuan-M2Plus を発表し、アプリケーション「百小応」をアップグレードし API インターフェースを公開しました。評価結果によると、このモデルの医療における幻覚率は汎用的な大規模モデルよりも顕著に低く、DeepSeek と比べて約3倍低いことが判明し、米国の OpenEvidence アプリケーションよりも優れた性能を示しています。

Oct 22, 2025