微软CEO宣布,位于美国威斯康辛州的Fairwater AI数据中心提前上线。该中心投资约225亿元人民币,占地127.6公顷,拥有数十万块英伟达GB200超级芯片,性能达全球最快超算的十倍,将用于前沿AI模型训练。
谷歌正与Marvell合作开发两款定制AI芯片,旨在减少对英伟达的依赖,强化自身云服务竞争力。此举凸显科技巨头在算力领域的激烈竞争。
AI芯片公司Cerebras与OpenAI达成一项为期三年、金额超亿美元的重磅交易,规模是年初协议的两倍,显示OpenAI对其技术的高度信任。OpenAI承诺提供约10亿美元支持Cerebras开发数据中心系统,并获得最高10%的少数股权认股凭证,深化战略合作。
特斯拉下一代AI5芯片已完成流片,预计2027年量产,将接替AI4成为自动驾驶和人形机器人的核心算力平台。其单芯片性能媲美英伟达Hopper架构,双芯配置表现更优。
开源AI芯片性能基准测试平台
快速AI推理,为开源模型提供即时智能。
Meta自研的下一代AI训练和推理加速芯片
世界上最快的AI芯片,拥有惊人的4万亿晶体管
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
mlx-community
GLM-4.5-Air-2bit是基于智谱AI的GLM-4.5-Air模型转换而来的2位量化版本,采用MLX格式优化,可在Apple芯片设备上高效运行。该模型支持文本生成任务,具有轻量级和高效率的特点。
lmstudio-community
由DeepSeek AI开发的大语言模型,经过4位量化优化,适用于苹果芯片设备。