英伟达向云服务商CoreWeave追加20亿美元投资,以每股87.20美元购买其A类股票。双方将合作建设“AI工厂”,目标到2030年新增超5吉瓦AI算力。新数据中心将全面集成英伟达最新技术栈,包括采用下一代Rubin架构芯片替代现有Blackwell架构。
微软发布新一代AI推理芯片Maia200,性能大幅提升,能效比和成本优势显著。芯片采用先进制程,集成超千亿晶体管,算力达Petaflops级别。
AI芯片设计初创公司Ricursive Intelligence完成3亿美元融资,估值达40亿美元。公司由前谷歌研究员创立,核心技术是利用AI自动设计AI芯片,其AlphaChip强化学习方法已应用于谷歌芯片设计。本轮融资由Lightspeed领投,英伟达风投等跟投。
微软推出第二代自研AI芯片Maia200,旨在提升Azure云服务AI推理效率,减少对英伟达GPU的依赖。该芯片由台积电代工,已开始向爱荷华州数据中心发货,后续将部署至凤凰城地区。微软高管称其为公司“最高效的推理系统”,将优先供内部超级AI团队使用。
开源AI芯片性能基准测试平台
快速AI推理,为开源模型提供即时智能。
Meta自研的下一代AI训练和推理加速芯片
世界上最快的AI芯片,拥有惊人的4万亿晶体管
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
mlx-community
GLM-4.5-Air-2bit是基于智谱AI的GLM-4.5-Air模型转换而来的2位量化版本,采用MLX格式优化,可在Apple芯片设备上高效运行。该模型支持文本生成任务,具有轻量级和高效率的特点。
lmstudio-community
由DeepSeek AI开发的大语言模型,经过4位量化优化,适用于苹果芯片设备。