全球50多位物理學家聯合開發“CritPt”基準測試,評估AI模型處理未公開復雜物理問題的能力,模擬博士研究生獨立研究水平。儘管谷歌Gemini3Pro和OpenAI GPT-5被寄予厚望,但結果令人失望,Gemini3Pro準確率僅9.1%,突顯AI在高級科研任務中的侷限。
最新物理基準測試“CritPt”顯示,頂尖AI模型如Gemini3Pro和GPT-5距離成爲自主科學家仍有巨大差距。該測試由全球50多位物理學家開發,重點考覈博士級科研實戰能力,而非單純知識記憶,突顯AI在創造性研究中的侷限性。
OpenAI發佈新一代GPT-5模型,強化計算與語言能力,重點應用於數學與科學研究。該技術有望加速藥物研發和新材料發現進程,助力科研高效解決複雜問題,順應AI推動科技發展的行業趨勢。
美國能源部與AMD簽署10億美元合作協議,將共同建造兩臺超級計算機,用於支持核能利用、癌症治療和國家安全等重大科研領域。美能源部長表示,此舉將顯著提升美國在複雜實驗中的數據處理能力。
Xai
$1.4
輸入tokens/百萬
$3.5
輸出tokens/百萬
2k
上下文長度
Openai
-
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$2
$20
$4
$16
$3.9
$15.2
64
Bytedance
$0.8
256
Moonshot
128
$0.15
$1.5
Baidu
32
Deepseek
$12
Tencent
$1
camenduru
FLUX.1 [dev] 是一個具有120億參數的整流流變壓器,專門用於文本到圖像生成。它在圖像生成質量方面表現卓越,僅次於FLUX.1 [pro],具有出色的提示跟隨能力和高效的訓練方式,為科研和創作提供強大支持。