近日,英偉達發佈了其全新的 Blackwell 平臺,並在 MLPerf Training4.1基準測試中展示了初步的性能表現。根據測試結果,Blackwell 在某些方面的性能相比於前一代 Hopper 平臺實現了翻倍的提升,這一成果引起了業界的廣泛關注。在 MLPerf Training4.1基準測試中,Blackwell 平臺在 LLM(大語言模型)基準的 Llama270B 微調任務中,每個 GPU 的性能達到了 Hopper 的2.2倍,而在 GPT-3175B 的預訓練中則達到了2倍的提升。此外,在 Stable Diffusion v2訓練等其他基準測試中,新一代的 Blackwell 也以1.7倍的優勢超過了前代產品
本文概述了AI推理芯片領域的最新發展,特別是MLPerf推理v4.1競賽的結果,該競賽彙集了來自AMD、谷歌、UntetherAI、Cerebras、FuriosaAI以及Nvidia等公司的最新芯片。Nvidia的H200和GH200芯片在“數據中心封閉”類別中保持領先,但其他公司的芯片在特定任務上表現出色,尤其是在能效方面。AMD的Instinct加速器、谷歌的Trillium加速器以及UntetherAI的speedAI240預覽芯片在不同任務上表現出色,顯示了市場上的競爭激烈。UntetherAI的芯片採用內存計算方法,顯示出在能效和延遲方面有顯著優勢。Cerebras和FuriosaAI雖然沒有參加MLPerf,但也發佈了新芯片,分別展示了其在內存帶寬和張量收縮處理器方面的創新。IBM的Spyre芯片則爲即將到來的市場增添了新的競爭者。整體而言,AI推理芯片市場的競爭日益激烈,創新技術不斷涌現,旨在提高性能、能效和成本效益。
["最近,MLPerf增加了針對訓練大型語言模型和基於文本生成圖像的測試。","英偉達、英特爾和谷歌都投入大型系統參與新基準測試。英偉達的10,000 GPU系統完成GPT-3訓練用時最短。","英特爾啓用Gaudi 2的8位浮點計算,性能有顯著提升,但仍落後於英偉達系統。","英偉達和微軟基於數萬GPU的系統在GPT-3訓練上展開激烈競爭。","計算機訓練生成式AI系統需要巨大算力,各企業紛紛投入更大規模的超級計算機。"]
["英偉達在MLPerf基準測試中展示了新型超級計算機Hopper。","Hopper配備1萬多塊H100 GPU,性能強勁。","與英特爾Gaudi2相比,Hopper每美元性能高出4倍。","除英偉達外,提交MLPerf結果的廠商寥寥無幾。","MLPerf訓練基準日益失去比較意義,但Hopper仍展示算力領先。"]
個人電腦AI性能基準測試