在2025年AWS re:Invent大会上,亚马逊云科技发布了新一代AI训练芯片Trainium3。该芯片采用3纳米制程,性能较上一代提升4倍,内存容量也增加4倍,能效提高40%,显著增强了高负载AI训练和推理能力。
高通发布AI200和AI250芯片挑战英伟达,股价涨超20%。AI200专为AI推理设计,支持768GB内存,旨在降低总成本并提升性能,适用于大型语言和多模态模型推理。
英伟达推出新一代机器人芯片Jetson Thor,算力提升7.5倍达2070FP4TFLOPS,功耗130W,能效提升3.5倍,内存128G,带宽273GB/s,大幅增强AI机器人性能。
英特尔近日首次曝光新一代AI芯片Jaguar Shores,目前正由热工程团队测试冷却方案。该芯片采用92.5mm×92.5mm封装,专为高性能计算平台设计,是英特尔首款机架级解决方案。采用18A先进工艺,配备HBM4内存,为多领域多IP产品。
Openai
$0.4
Input tokens/M
-
Output tokens/M
128
Context Length
Google
$140
$280
32
Tencent
$3
$9
16
Baidu
$0.1
Chatglm
$100
mlx-community
IBM Granite-4.0-H-Tiny是经过苹果硅芯片优化的混合Mamba-2/Transformer模型,采用3位量化技术,专为长上下文、高效推理和企业使用而设计。该模型结合了Mamba-2架构和专家混合技术,在保持表达能力的同时显著降低内存占用。
Apriel-1.5-15B-Thinker是一个专为图像理解与推理设计的150亿参数多模态模型,采用中期训练方法而非RLHF训练。本版本为适用于苹果芯片的MLX量化版本,具有内存占用小、启动速度快的特点。
abnormalmapstudio
这是基于Qwen3-Next-80B-A3B-Thinking基础模型的苹果MLX优化4位mxfp4量化版本,专门针对苹果硅芯片优化,可在Mac设备上实现高效的本地推理,显著降低内存占用同时保持良好性能。