國產AI芯片與大模型協同優化取得重要進展。摩爾線程與硅基流動基於國產GPU MTT S5000,成功完成對千億參數大模型DeepSeek V3 671B的深度適配。通過應用FP8低精度推理技術,實現單卡預填充吞吐量超4000 tokens/秒,解碼吞吐量超1000 tokens/秒,推理速度已接近國際主流高端AI加速器水平。
印度AI初創公司Aivar完成460萬美元種子輪融資,由Sorin Investments領投,Bessemer Venture Partners跟投。資金將用於拓展印度、美國和中東市場,並投資AI加速器、人才及國際交付能力。其自動化加速器Velogent已成功優化物流SaaS合同處理系統,運用代理式AI提升效率。
雷蛇在2026年CES上推出Forge AI工作站,進軍AI開發者硬件市場。該產品線提供塔式和機架式兩種形態,專爲AI訓練與推理優化,旨在爲開發者、研究人員及中小企業提供高性能、靈活的本地大模型基礎設施解決方案。
百度旗下崑崙芯科技向港交所提交IPO申請,帶動股價上漲。公司自2021年獨立運營,現爲國內第二大AI芯片製造商,源於2011年百度內部FPGA加速器項目,2018年推出首款自研芯片。
用於衡量設備 AI 加速器推理性能的基準測試工具。
高性能AI加速器,專為AI工作負載設計。
微軟定製AI加速器,專為大規模AI工作負載設計。
AI加速器,推動人工智能的突破
Anthropic
$105
輸入tokens/百萬
$525
輸出tokens/百萬
200
上下文長度
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$6
$24
256
Baidu
-
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
$0.8
$0.15
$1.5
32
Deepseek
$4
$12
Tencent
$1