國產AI硬件與軟件協同發展取得新突破。摩爾線程MTT S5000 GPU已完成對智譜GLM-5大模型的全流程適配,實現國產算力與大模型的深度結合。該GPU基於自研“平湖”架構,專爲大模型訓練與推理設計,標誌着國產AI生態自主化進程的關鍵一步。
摩爾線程發佈AI Coding Plan智能編程服務,基於國產GPU MTT S5000提供算力支撐,結合硅基流推理加速技術,旨在革新軟件開發模式,提升國內AI編程滲透率。
國產AI芯片與大模型協同優化取得重要進展。摩爾線程與硅基流動基於國產GPU MTT S5000,成功完成對千億參數大模型DeepSeek V3 671B的深度適配。通過應用FP8低精度推理技術,實現單卡預填充吞吐量超4000 tokens/秒,解碼吞吐量超1000 tokens/秒,推理速度已接近國際主流高端AI加速器水平。
摩爾線程自主研發的MUSA架構成功適配開源推理框架llama.cpp,支持在MTT S80/S3000/S4000系列GPU上高效運行AI推理。此前MUSA SDK已擴展至Intel和海光平臺,此次適配進一步降低了大模型部署門檻。llama.cpp作爲輕量化跨硬件框架,支持LLaMA、Mistral等模型及多模態應用。這一突破爲國內AI硬件生態注入新活力,推動AI技術在各領域的應用普及。
Anthropic
$105
輸入tokens/百萬
$525
輸出tokens/百萬
200
上下文長度
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$6
$24
256
Baidu
-
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
$0.8
$0.15
$1.5
32
Deepseek
$4
$12