国产AI芯片与大模型协同优化取得重要进展。摩尔线程与硅基流动基于国产GPU MTT S5000,成功完成对千亿参数大模型DeepSeek V3 671B的深度适配。通过应用FP8低精度推理技术,实现单卡预填充吞吐量超4000 tokens/秒,解码吞吐量超1000 tokens/秒,推理速度已接近国际主流高端AI加速器水平。
印度AI初创公司Aivar完成460万美元种子轮融资,由Sorin Investments领投,Bessemer Venture Partners跟投。资金将用于拓展印度、美国和中东市场,并投资AI加速器、人才及国际交付能力。其自动化加速器Velogent已成功优化物流SaaS合同处理系统,运用代理式AI提升效率。
雷蛇在2026年CES上推出Forge AI工作站,进军AI开发者硬件市场。该产品线提供塔式和机架式两种形态,专为AI训练与推理优化,旨在为开发者、研究人员及中小企业提供高性能、灵活的本地大模型基础设施解决方案。
百度旗下昆仑芯科技向港交所提交IPO申请,带动股价上涨。公司自2021年独立运营,现为国内第二大AI芯片制造商,源于2011年百度内部FPGA加速器项目,2018年推出首款自研芯片。
用于衡量设备 AI 加速器推理性能的基准测试工具。
高性能AI加速器,专为AI工作负载设计。
微软定制AI加速器,专为大规模AI工作负载设计。
AI加速器,推动人工智能的突破
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64