微軟發佈新一代AI推理芯片Maia200,性能大幅提升,能效比和成本優勢顯著。芯片採用先進製程,集成超千億晶體管,算力達Petaflops級別。
微軟推出第二代自研AI芯片Maia200,旨在提升Azure雲服務AI推理效率,減少對英偉達GPU的依賴。該芯片由臺積電代工,已開始向愛荷華州數據中心發貨,後續將部署至鳳凰城地區。微軟高管稱其爲公司“最高效的推理系統”,將優先供內部超級AI團隊使用。
曦望(Sunrise)作爲AI推理專用GPU芯片公司,在成立一年內完成近30億元融資,創國內AI芯片初創企業早期融資紀錄。此輪融資匯聚產業資本、頭部VC/PE及國家級基金,顯示市場對其技術及國產替代前景的認可。投資方包括三一集團旗下華胥基金等,凸顯高端製造與AI芯片的戰略協同。
國產AI芯片與大模型協同優化取得重要進展。摩爾線程與硅基流動基於國產GPU MTT S5000,成功完成對千億參數大模型DeepSeek V3 671B的深度適配。通過應用FP8低精度推理技術,實現單卡預填充吞吐量超4000 tokens/秒,解碼吞吐量超1000 tokens/秒,推理速度已接近國際主流高端AI加速器水平。
Meta自研的下一代AI訓練和推理加速芯片
Anthropic
$7
輸入tokens/百萬
$35
輸出tokens/百萬
200
上下文長度
Google
$2.1
$17.5
1k
$21
$105
$0.7
$2.8
Alibaba
$6
$24
256
Baidu
-
128
$2
Bytedance
$0.8
32
Deepseek
$4
$12
Tencent
$1
$54
$163
$1.6
Openai
$0.4
$15
$525
Huawei