本文概述了AI推理芯片领域的最新发展,特别是MLPerf推理v4.1竞赛的结果,该竞赛汇集了来自AMD、谷歌、UntetherAI、Cerebras、FuriosaAI以及Nvidia等公司的最新芯片。Nvidia的H200和GH200芯片在“数据中心封闭”类别中保持领先,但其他公司的芯片在特定任务上表现出色,尤其是在能效方面。AMD的Instinct加速器、谷歌的Trillium加速器以及UntetherAI的speedAI240预览芯片在不同任务上表现出色,显示了市场上的竞争激烈。UntetherAI的芯片采用内存计算方法,显示出在能效和延迟方面有显著优势。Cerebras和FuriosaAI虽然没有参加MLPerf,但也发布了新芯片,分别展示了其在内存带宽和张量收缩处理器方面的创新。IBM的Spyre芯片则为即将到来的市场增添了新的竞争者。整体而言,AI推理芯片市场的竞争日益激烈,创新技术不断涌现,旨在提高性能、能效和成本效益。
["OpenAICEO 萨姆・奥特曼近日再次为一家人工智能芯片企业筹集了数十亿美元的资金,希望建立一个范围覆盖全球的晶圆厂「企业网络」,并计划与未具名的顶级芯片制造商合作。","奥特曼已与几家大型潜在投资者进行了谈判,希望能筹集到晶圆厂所需的巨额资金。","面向生成式 AI 的计算,英伟达已经发布了下一代 GH200GraceHopper 芯片,以扩大其在该领域的主导地位竞争对手 AMD、高通和英特尔也推出了旨在为笔记本电脑、手机和其他设备上运行的人工智能模型提供支持的处理器。"]
["AWS将首次引入NVIDIA GH200 Grace Hopper Superchips,提供规模化的云上AI计算。","合作包括在AWS上托管首个搭载GH200 NVL32的NVIDIA DGX Cloud,加速生成式AI和语言模型训练。","推出新的Amazon EC2实例,包括用于生成式AI的P5e实例和适用于各种应用的G6、G6e实例。","合作涉及软件开发,包括NVIDIA NeMo Retriever和BioNeMo,提供聊天机器人和药物发现模型训练工具。"]
["英伟达CEO黄仁勋将参加10月18日鸿海科技日活动,与鸿海董事长刘扬伟共同亮相。","鸿海获得英伟达AI芯片GH200和L40/L40S芯片模块独家供应权。","鸿海具备从模块到整个数据中心全产业链优势,是英伟达完整解决方案的唯一制造商。","鸿海获得英伟达车载产品一级供应商资格,合作进军汽车电子市场。","英伟达AI峰会因以色列局势不稳取消,转为线上形式仍未确定。"]