最好的科研能力 AI工具模型_精選科研能力資訊

AI資訊

領先 AI 模型在複雜物理任務中表現不佳，仍需人類助力

全球50多位物理學家聯合開發“CritPt”基準測試，評估AI模型處理未公開復雜物理問題的能力，模擬博士研究生獨立研究水平。儘管谷歌Gemini3Pro和OpenAI GPT-5被寄予厚望，但結果令人失望，Gemini3Pro準確率僅9.1%，突顯AI在高級科研任務中的侷限。

9.8k 昨天

AI 離諾獎有多遠?頂級模型在博士級物理基準測試“CritPt”中慘敗，準確率不足10%

最新物理基準測試“CritPt”顯示，頂尖AI模型如Gemini3Pro和GPT-5距離成爲自主科學家仍有巨大差距。該測試由全球50多位物理學家開發，重點考覈博士級科研實戰能力，而非單純知識記憶，突顯AI在創造性研究中的侷限性。

10.7k 3 小時前

AI 離諾獎有多遠?頂級模型在博士級物理基準測試“CritPt”中慘敗，準確率不足10%

OpenAI 發佈新 GPT-5 模型，加速數學與科學研究

OpenAI發佈新一代GPT-5模型，強化計算與語言能力，重點應用於數學與科學研究。該技術有望加速藥物研發和新材料發現進程，助力科研高效解決複雜問題，順應AI推動科技發展的行業趨勢。

11.5k 3 天前

美國能源部與 AMD 達成十億合作共建超級計算機和AI項目

美國能源部與AMD簽署10億美元合作協議，將共同建造兩臺超級計算機，用於支持核能利用、癌症治療和國家安全等重大科研領域。美能源部長表示，此舉將顯著提升美國在複雜實驗中的數據處理能力。

8.4k 2 天前

模型

Grok 4 Fast

Xai

$1.4

輸入tokens/百萬

$3.5

輸出tokens/百萬

上下文長度

GPT-5 Codex

Openai

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Claude 3 Opus

Anthropic

$105

輸入tokens/百萬

$525

輸出tokens/百萬

200

上下文長度

Gemini 2.0 Flash

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

Claude Haiku 4.5

Anthropic

輸入tokens/百萬

$35

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash

Google

$2.1

輸入tokens/百萬

$17.5

輸出tokens/百萬

上下文長度

Claude Sonnet 4.5

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Claude 3 Sonnet

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

qwen3-vl-235b-a22b-thinking

Alibaba

輸入tokens/百萬

$20

輸出tokens/百萬

上下文長度

qwen3-coder-plus

Alibaba

輸入tokens/百萬

$16

輸出tokens/百萬

上下文長度

wan2.5-i2v-preview

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen3-omni-flash-realtime

Alibaba

$3.9

輸入tokens/百萬

$15.2

輸出tokens/百萬

上下文長度

Doubao-Seed-1.6

Bytedance

$0.8

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

Kimi-K2

Moonshot

輸入tokens/百萬

$16

輸出tokens/百萬

256

上下文長度

Doubao-1.5-pro-32k

Bytedance

$0.8

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

qwen3-asr-flash

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Doubao-Seed-1.6-flash

Bytedance

$0.15

輸入tokens/百萬

$1.5

輸出tokens/百萬

256

上下文長度

Qianfan-VL-8B

Baidu

輸入tokens/百萬

輸出tokens/百萬

上下文長度

DeepSeek-V3.1

Deepseek

輸入tokens/百萬

$12

輸出tokens/百萬

128

上下文長度

Hunyuan-T1-20250822

Tencent

輸入tokens/百萬

輸出tokens/百萬

上下文長度

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

領先 AI 模型在複雜物理任務中表現不佳，仍需人類助力

AI 離諾獎有多遠?頂級模型在博士級物理基準測試“CritPt”中慘敗，準確率不足10%

OpenAI 發佈新 GPT-5 模型，加速數學與科學研究

美國能源部與 AMD 達成十億合作 共建超級計算機和AI項目

模型

Grok 4 Fast

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

qwen3-vl-235b-a22b-thinking

qwen3-coder-plus

wan2.5-i2v-preview

qwen3-omni-flash-realtime

Doubao-Seed-1.6

Kimi-K2

Doubao-1.5-pro-32k

qwen3-asr-flash

Doubao-Seed-1.6-flash

Qianfan-VL-8B

DeepSeek-V3.1

Hunyuan-T1-20250822

FLUX.1 Dev Ungated

美國能源部與 AMD 達成十億合作共建超級計算機和AI項目