微软Azure ND GB300v6虚拟机在Llama270B模型上创下每秒110万token推理速度新纪录。该成就基于与英伟达的深度合作,采用配备72个Blackwell Ultra GPU和36个Grace CPU的NVIDIA GB300NVL72系统,突显微软在规模化AI运算领域的专业实力。
Lambda与微软达成大规模AI基础设施合作,将部署数万台Nvidia GPU,包括最新GB300NVL72系统。具体交易金额未公开。Lambda CEO表示双方正合作部署大型AI超级计算机。