OpenAI加速推进“去英伟达化”战略,于2026年2月12日发布首款基于Cerebras芯片的AI模型GPT-5.3-Codex-Spark。该模型专为软件工程师设计,提供更灵活的交互体验,支持即时中断与切换,使开发者能随时暂停冗长计算,快速处理其他紧急编码任务。
字节跳动正加速自研AI芯片“SeedChip”,计划今年量产至少10万颗,主要面向推理任务,以保障AI算力供应。尽管公司称相关报道“不准确”,但其今年AI采购预算已超1600亿元,半数仍用于购买英伟达芯片,反映出在推进大模型时面临的高推理成本压力。
DEEPX与神州数码合作,利用高性能低功耗芯片技术,加速物理AI在中国市场应用,填补高性能与超低功耗之间的市场空白。
谷歌母公司Alphabet计划发行约200亿美元债券,以支持其2026年高达1850亿美元的资本开支预算。资金将重点投向AI芯片、数据中心和云计算等AI基础设施领域,以应对全球AI竞争。
开源AI芯片性能基准测试平台
Meta自研的下一代AI训练和推理加速芯片
世界上最快的AI芯片,拥有惊人的4万亿晶体管
Xai
$1.4
输入tokens/百万
$3.5
输出tokens/百万
2k
上下文长度
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
mlx-community
GLM-4.5-Air-2bit是基于智谱AI的GLM-4.5-Air模型转换而来的2位量化版本,采用MLX格式优化,可在Apple芯片设备上高效运行。该模型支持文本生成任务,具有轻量级和高效率的特点。
lmstudio-community
由DeepSeek AI开发的大语言模型,经过4位量化优化,适用于苹果芯片设备。