马斯克旗下xAI公司启动全球首个吉瓦级AI训练集群“Colossus2”,用于驱动Grok聊天机器人。该超级计算机占地约13个足球场,配备10万块英伟达H100芯片,标志着AI算力竞赛进入新阶段。
初创公司Starcloud成功在太空轨道上训练大语言模型,成为全球首例。其卫星搭载英伟达H100芯片,并运行基于谷歌开源模型Gemma的应用程序,开启了太空数据中心的新纪元。公司计划为客户提供商业服务,卫星发回的信号展示了其独特视角。
Meta CEO扎克伯格亲自负责AI商业化,新一代大模型“Avocado”计划2026年春季发布,将仅提供API和托管服务,不再开源。该模型整合了谷歌、OpenAI及阿里等第三方开源技术,目标达到前沿性能。Meta已与英伟达签署50亿美元H100订单,专门用于模型训练。
普林斯顿团队推出纯Python开发的QuACK内核库,采用CuTe-DSL技术,在H100显卡上比PyTorch提速33%-50%。研究聚焦内存密集型内核优化,通过精准处理GPU内存层级结构等关键细节实现性能突破。英伟达专家盛赞该技术让GPU高效运行更易实现,PyTorch团队认为其长序列处理优势突出。团队已发布详细教程,分享利用GPU硬件特性提升内存密集型内核性能的实用方法。
Tencent
$2.4
Input tokens/M
$9.6
Output tokens/M
32
Context Length
Moonshot
$8
$32
262