人工智能产业爆发式增长冲击消费电子供应链,苹果公司受影响显著。内存芯片价格飙升,DRAM年底或较去年翻两番,NAND闪存价格激增三倍以上,成本压力将体现在秋季发布的入门级iPhone18上。
华硕推出UGen300 AI加速卡,采用USB接口设计,无需拆机或占用PCIe插槽,通过USB 3.1 Gen2线缆即可为PC、工控机等设备提供40 TOPS的本地AI推理能力。核心搭载Hailo-10H NPU芯片,功耗仅2.5瓦,板载8GB内存,支持直接运行大型预训练模型。
在2025年AWS re:Invent大会上,亚马逊云科技发布了新一代AI训练芯片Trainium3。该芯片采用3纳米制程,性能较上一代提升4倍,内存容量也增加4倍,能效提高40%,显著增强了高负载AI训练和推理能力。
高通发布AI200和AI250芯片挑战英伟达,股价涨超20%。AI200专为AI推理设计,支持768GB内存,旨在降低总成本并提升性能,适用于大型语言和多模态模型推理。
Openai
$0.4
Input tokens/M
-
Output tokens/M
128
Context Length
Google
$140
$280
32
Tencent
$3
$9
16
Baidu
$0.1
Chatglm
$100
mlx-community
IBM Granite-4.0-H-Tiny是经过苹果硅芯片优化的混合Mamba-2/Transformer模型,采用3位量化技术,专为长上下文、高效推理和企业使用而设计。该模型结合了Mamba-2架构和专家混合技术,在保持表达能力的同时显著降低内存占用。
Apriel-1.5-15B-Thinker是一个专为图像理解与推理设计的150亿参数多模态模型,采用中期训练方法而非RLHF训练。本版本为适用于苹果芯片的MLX量化版本,具有内存占用小、启动速度快的特点。
abnormalmapstudio
这是基于Qwen3-Next-80B-A3B-Thinking基础模型的苹果MLX优化4位mxfp4量化版本,专门针对苹果硅芯片优化,可在Mac设备上实现高效的本地推理,显著降低内存占用同时保持良好性能。