国产AI硬件与软件协同发展取得新突破。摩尔线程MTT S5000 GPU已完成对智谱GLM-5大模型的全流程适配,实现国产算力与大模型的深度结合。该GPU基于自研“平湖”架构,专为大模型训练与推理设计,标志着国产AI生态自主化进程的关键一步。
摩尔线程发布AI Coding Plan智能编程服务,基于国产GPU MTT S5000提供算力支撑,结合硅基流推理加速技术,旨在革新软件开发模式,提升国内AI编程渗透率。
国产AI芯片与大模型协同优化取得重要进展。摩尔线程与硅基流动基于国产GPU MTT S5000,成功完成对千亿参数大模型DeepSeek V3 671B的深度适配。通过应用FP8低精度推理技术,实现单卡预填充吞吐量超4000 tokens/秒,解码吞吐量超1000 tokens/秒,推理速度已接近国际主流高端AI加速器水平。
摩尔线程自主研发的MUSA架构成功适配开源推理框架llama.cpp,支持在MTT S80/S3000/S4000系列GPU上高效运行AI推理。此前MUSA SDK已扩展至Intel和海光平台,此次适配进一步降低了大模型部署门槛。llama.cpp作为轻量化跨硬件框架,支持LLaMA、Mistral等模型及多模态应用。这一突破为国内AI硬件生态注入新活力,推动AI技术在各领域的应用普及。
Xai
$1.4
输入tokens/百万
$3.5
输出tokens/百万
2k
上下文长度
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64