近日,英伟达发布了其全新的 Blackwell 平台,并在 MLPerf Training4.1基准测试中展示了初步的性能表现。根据测试结果,Blackwell 在某些方面的性能相比于前一代 Hopper 平台实现了翻倍的提升,这一成果引起了业界的广泛关注。在 MLPerf Training4.1基准测试中,Blackwell 平台在 LLM(大语言模型)基准的 Llama270B 微调任务中,每个 GPU 的性能达到了 Hopper 的2.2倍,而在 GPT-3175B 的预训练中则达到了2倍的提升。此外,在 Stable Diffusion v2训练等其他基准测试中,新一代的 Blackwell 也以1.7倍的优势超过了前代产品
本文概述了AI推理芯片领域的最新发展,特别是MLPerf推理v4.1竞赛的结果,该竞赛汇集了来自AMD、谷歌、UntetherAI、Cerebras、FuriosaAI以及Nvidia等公司的最新芯片。Nvidia的H200和GH200芯片在“数据中心封闭”类别中保持领先,但其他公司的芯片在特定任务上表现出色,尤其是在能效方面。AMD的Instinct加速器、谷歌的Trillium加速器以及UntetherAI的speedAI240预览芯片在不同任务上表现出色,显示了市场上的竞争激烈。UntetherAI的芯片采用内存计算方法,显示出在能效和延迟方面有显著优势。Cerebras和FuriosaAI虽然没有参加MLPerf,但也发布了新芯片,分别展示了其在内存带宽和张量收缩处理器方面的创新。IBM的Spyre芯片则为即将到来的市场增添了新的竞争者。整体而言,AI推理芯片市场的竞争日益激烈,创新技术不断涌现,旨在提高性能、能效和成本效益。
["最近,MLPerf增加了针对训练大型语言模型和基于文本生成图像的测试。","英伟达、英特尔和谷歌都投入大型系统参与新基准测试。英伟达的10,000 GPU系统完成GPT-3训练用时最短。","英特尔启用Gaudi 2的8位浮点计算,性能有显著提升,但仍落后于英伟达系统。","英伟达和微软基于数万GPU的系统在GPT-3训练上展开激烈竞争。","计算机训练生成式AI系统需要巨大算力,各企业纷纷投入更大规模的超级计算机。"]
["英伟达在MLPerf基准测试中展示了新型超级计算机Hopper。","Hopper配备1万多块H100 GPU,性能强劲。","与英特尔Gaudi2相比,Hopper每美元性能高出4倍。","除英伟达外,提交MLPerf结果的厂商寥寥无几。","MLPerf训练基准日益失去比较意义,但Hopper仍展示算力领先。"]
个人电脑AI性能基准测试