2026年2月,中国人工智能产业发展联盟第十六次全会召开,强调将制造业作为AI赋能主战场,全力推进“人工智能+制造”向深层次发展。工信部明确四项关键发力点:构建智能化工业体系,重点突破算力芯片、工业大模型等核心技术,以全面提升产业竞争力。
人工智能产业爆发式增长冲击消费电子供应链,苹果公司受影响显著。内存芯片价格飙升,DRAM年底或较去年翻两番,NAND闪存价格激增三倍以上,成本压力将体现在秋季发布的入门级iPhone18上。
OpenAI正寻求英伟达之外的AI算力替代方案,因其对英伟达最新芯片在推理环节的响应速度不满。公司发现,在代码生成等复杂交互中,硬件速度已成瓶颈,因此战略重心正从模型训练转向推理优化。
OpenAI计划融资1000亿美元以支持AI业务发展,英伟达考虑追加投资300亿美元。作为关键芯片供应商,英伟达的算力是OpenAI模型训练的核心支撑。
iPhone 16e:最新iPhone,价格亲民,性能卓越,配备A18芯片和48MP融合相机。
全球首款基于拓扑核心架构的量子芯片,为量子计算开辟新路径。
FlagCX是一个跨芯片通信库。
开源AI芯片性能基准测试平台
Tencent
$3
Input tokens/M
$9
Output tokens/M
16
Context Length
Baidu
-
32
$0.1
$0.4
128
Chatglm
$100
kyr0
这是一个专为苹果硅芯片设备优化的自动语音识别模型,通过转换为MLX框架并量化为FP8格式,实现在苹果设备上的快速端上语音转录。该模型针对逐字精度进行微调,特别适用于需要高精度转录的场景。
mlx-community
VibeThinker-1.5B的4位量化版本,基于MLX框架针对苹果芯片优化,是一个拥有15亿参数的密集语言模型,专门用于数学推理和算法编码问题
McG-221
本模型是Falcon-H1-34B-Instruct指令微调版本的MLX格式转换版,专为Apple Silicon(M系列芯片)优化。它基于原始的Falcon-H1-34B-Instruct模型,通过mlx-lm工具转换为MLX框架兼容的8位量化格式,旨在在macOS设备上实现高效的本地推理。
本模型是基于moonshotai的Kimi-Linear-48B-A3B-Instruct大语言模型,使用mlx-lm工具转换为适用于Apple Silicon芯片(MLX框架)的8位量化版本。它是一个48B参数的指令微调模型,专为遵循人类指令和对话交互而设计。
lmstudio-community
Qwen3-VL-2B-Thinking是由Qwen推出的视觉语言模型,基于2B参数规模,使用MLX进行8位量化,专门针对Apple Silicon芯片进行了优化。该模型支持图像和文本的多模态理解与生成任务。
Granite-4.0-H-1B-8bit 是 IBM Granite 系列的小型语言模型,专门针对 Apple Silicon 芯片优化,采用 8 位量化技术,参数量为 1B,具有高效推理和低资源消耗的特点。
MiniMax-M2-4bit 是使用 mlx-lm 工具从 MiniMaxAI/MiniMax-M2 转换而来的 4 位量化版本,专门针对 Apple Silicon 芯片优化,提供高效的文本生成能力。
DeepSeek-OCR-8bit是基于DeepSeek-OCR模型转换的MLX格式版本,专门针对苹果芯片优化的视觉语言模型,支持多语言OCR识别和图像文本理解任务。
DeepSeek-OCR-6bit是基于DeepSeek-OCR模型转换的MLX格式版本,专门针对苹果芯片优化。这是一个视觉语言模型,具备强大的光学字符识别能力,能够从图像中提取和识别文本信息。
Wwayu
这是一个基于GLM-4.6架构的混合专家模型,使用REAP方法对专家进行了40%的均匀剪枝,参数量为218B,并转换为MLX格式的3位量化版本,适用于苹果芯片设备高效运行。
Qwen3-VL-32B-Instruct是一个强大的多模态视觉语言模型,基于Qwen基础模型开发,经过优化和量化处理,专门针对苹果芯片设备进行了优化,提供高效的图像文本处理能力。
Qwen3-VL-2B-Instruct 是一款高效的图像文本转文本模型,由 Qwen 团队开发。该模型经过 MLX 8位量化优化,特别适用于苹果硅芯片设备,能够处理视觉语言任务并提供高效的解决方案。
manasmisra
该模型是基于GLM-4.5-Air使用REAP方法进行25%均匀剪枝后的专家混合模型,已转换为MLX格式的4位量化版本,适用于苹果芯片设备的高效推理。
nightmedia
这是一个基于Qwen3-Coder-REAP-25B-A3B模型转换的MLX格式版本,使用mlx-lm工具从原始模型转换而来,专门针对Apple Silicon芯片优化,支持高效的文本生成任务。
这是Qwen3-VL-4B-Instruct模型的4位量化版本,专门针对Apple Silicon芯片优化,使用MLX框架转换。该模型是一个视觉语言模型,支持图像理解和多模态对话任务。
Qwen3-VL-8B-Instruct是由Qwen团队开发的多模态视觉语言模型,支持图像文本到文本转换。该版本经过MLX 8位量化处理,专门针对苹果硅芯片进行优化,在保持性能的同时提升运行效率。
LFM2-8B-A1B是针对苹果硅芯片优化的8位量化MLX构建版本,采用专家混合(MoE)架构,总参数约80亿,每个令牌激活约10亿参数,支持设备端快速推理。
这是一个基于GLM-4.6模型转换的MLX格式版本,采用8位量化技术,分组大小为32,专为苹果芯片优化,提供高效的文本生成功能。
IBM Granite-4.0-H-Tiny模型的5-bit量化版本,专为苹果硅芯片优化。采用Mamba-2与软注意力混合架构,结合混合专家模型(MoE),在保持高质量的同时实现高效推理。
IBM Granite-4.0-H-Tiny是经过苹果硅芯片优化的混合Mamba-2/Transformer模型,采用3位量化技术,专为长上下文、高效推理和企业使用而设计。该模型结合了Mamba-2架构和专家混合技术,在保持表达能力的同时显著降低内存占用。
VGGT-MPS是基于苹果芯片优化的3D视觉重建工具,使用Metal Performance Shaders加速,能够从单张或多张图像生成深度图、相机姿态和3D点云,支持稀疏注意力实现城市级重建。
一个基于MLX Whisper的音频转录MCP服务,支持本地文件、Base64音频和YouTube视频转录,专为苹果M系列芯片优化。