马斯克预言,未来3年内太空将成为AI部署最具成本效益的地点。他认为,当前AI发展面临的核心瓶颈并非芯片短缺,而是地球能源供应无法满足AI基础设施的爆发式增长需求。
马斯克在播客中预测,由于地球电力增长停滞,未来三年内太空将成为部署AI成本最低、效率最高的地方。他指出全球面临电力瓶颈,芯片产出指数增长而电力增长几乎持平,预言到2026年底人类可能面临电力短缺,推动“太空GPU”成为资本市场关注焦点。
Positron发布AI推理芯片Asimov,宣称其能效比和性价比预计达英伟达下一代产品的5倍,引发行业关注。该芯片针对大模型推理优化,通过简化GPU架构提升效率。
Cerebras完成10亿美元H轮融资,估值飙升至230亿美元。本轮由Tiger Global领投,AMD战略参与。距离上轮81亿美元估值仅四个月,增长迅猛。
开源AI芯片性能基准测试平台
快速AI推理,为开源模型提供即时智能。
Meta自研的下一代AI训练和推理加速芯片
世界上最快的AI芯片,拥有惊人的4万亿晶体管
Xai
$1.4
输入tokens/百万
$3.5
输出tokens/百万
2k
上下文长度
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
mlx-community
GLM-4.5-Air-2bit是基于智谱AI的GLM-4.5-Air模型转换而来的2位量化版本,采用MLX格式优化,可在Apple芯片设备上高效运行。该模型支持文本生成任务,具有轻量级和高效率的特点。
lmstudio-community
由DeepSeek AI开发的大语言模型,经过4位量化优化,适用于苹果芯片设备。