中国第三代自主超导量子计算机“本源悟空”已初步具备搭载AI的运算能力,标志着国产量子算力开始系统性融入人工智能应用生态,开启“量子+AI”协同发展新篇章。该计算机于2024年1月投入运行,搭载72位自主超导量子芯片“悟空芯”,此次技术升级不仅是计算能力的提升,更是量子计算与人工智能融合的重要里程碑。
2026年春季招聘数据显示,新兴生产力行业人才需求激增。人工智能工程师最为抢手,平均月薪达20804元,岗位缺口持续扩大。机器人、新材料行业招聘岗位同比增长超30%,光电子、人工智能、航空航天等领域增长也接近或超过20%。薪资方面,人工智能工程师月薪领先,芯片工程师紧随其后。
微软CEO宣布,位于美国威斯康辛州的Fairwater AI数据中心提前上线。该中心投资约225亿元人民币,占地127.6公顷,拥有数十万块英伟达GB200超级芯片,性能达全球最快超算的十倍,将用于前沿AI模型训练。
谷歌正与Marvell合作开发两款定制AI芯片,旨在减少对英伟达的依赖,强化自身云服务竞争力。此举凸显科技巨头在算力领域的激烈竞争。
iPhone 16e:最新iPhone,价格亲民,性能卓越,配备A18芯片和48MP融合相机。
全球首款基于拓扑核心架构的量子芯片,为量子计算开辟新路径。
FlagCX是一个跨芯片通信库。
开源AI芯片性能基准测试平台
Tencent
$3
Input tokens/M
$9
Output tokens/M
16
Context Length
Baidu
-
32
$0.1
$0.4
128
Chatglm
$100
kyr0
这是一个专为苹果硅芯片设备优化的自动语音识别模型,通过转换为MLX框架并量化为FP8格式,实现在苹果设备上的快速端上语音转录。该模型针对逐字精度进行微调,特别适用于需要高精度转录的场景。
mlx-community
VibeThinker-1.5B的4位量化版本,基于MLX框架针对苹果芯片优化,是一个拥有15亿参数的密集语言模型,专门用于数学推理和算法编码问题
McG-221
本模型是Falcon-H1-34B-Instruct指令微调版本的MLX格式转换版,专为Apple Silicon(M系列芯片)优化。它基于原始的Falcon-H1-34B-Instruct模型,通过mlx-lm工具转换为MLX框架兼容的8位量化格式,旨在在macOS设备上实现高效的本地推理。
本模型是基于moonshotai的Kimi-Linear-48B-A3B-Instruct大语言模型,使用mlx-lm工具转换为适用于Apple Silicon芯片(MLX框架)的8位量化版本。它是一个48B参数的指令微调模型,专为遵循人类指令和对话交互而设计。
lmstudio-community
Qwen3-VL-2B-Thinking是由Qwen推出的视觉语言模型,基于2B参数规模,使用MLX进行8位量化,专门针对Apple Silicon芯片进行了优化。该模型支持图像和文本的多模态理解与生成任务。
Granite-4.0-H-1B-8bit 是 IBM Granite 系列的小型语言模型,专门针对 Apple Silicon 芯片优化,采用 8 位量化技术,参数量为 1B,具有高效推理和低资源消耗的特点。
MiniMax-M2-4bit 是使用 mlx-lm 工具从 MiniMaxAI/MiniMax-M2 转换而来的 4 位量化版本,专门针对 Apple Silicon 芯片优化,提供高效的文本生成能力。
DeepSeek-OCR-8bit是基于DeepSeek-OCR模型转换的MLX格式版本,专门针对苹果芯片优化的视觉语言模型,支持多语言OCR识别和图像文本理解任务。
DeepSeek-OCR-6bit是基于DeepSeek-OCR模型转换的MLX格式版本,专门针对苹果芯片优化。这是一个视觉语言模型,具备强大的光学字符识别能力,能够从图像中提取和识别文本信息。
Wwayu
这是一个基于GLM-4.6架构的混合专家模型,使用REAP方法对专家进行了40%的均匀剪枝,参数量为218B,并转换为MLX格式的3位量化版本,适用于苹果芯片设备高效运行。
Qwen3-VL-32B-Instruct是一个强大的多模态视觉语言模型,基于Qwen基础模型开发,经过优化和量化处理,专门针对苹果芯片设备进行了优化,提供高效的图像文本处理能力。
Qwen3-VL-2B-Instruct 是一款高效的图像文本转文本模型,由 Qwen 团队开发。该模型经过 MLX 8位量化优化,特别适用于苹果硅芯片设备,能够处理视觉语言任务并提供高效的解决方案。
manasmisra
该模型是基于GLM-4.5-Air使用REAP方法进行25%均匀剪枝后的专家混合模型,已转换为MLX格式的4位量化版本,适用于苹果芯片设备的高效推理。
nightmedia
这是一个基于Qwen3-Coder-REAP-25B-A3B模型转换的MLX格式版本,使用mlx-lm工具从原始模型转换而来,专门针对Apple Silicon芯片优化,支持高效的文本生成任务。
这是Qwen3-VL-4B-Instruct模型的4位量化版本,专门针对Apple Silicon芯片优化,使用MLX框架转换。该模型是一个视觉语言模型,支持图像理解和多模态对话任务。
Qwen3-VL-8B-Instruct是由Qwen团队开发的多模态视觉语言模型,支持图像文本到文本转换。该版本经过MLX 8位量化处理,专门针对苹果硅芯片进行优化,在保持性能的同时提升运行效率。
LFM2-8B-A1B是针对苹果硅芯片优化的8位量化MLX构建版本,采用专家混合(MoE)架构,总参数约80亿,每个令牌激活约10亿参数,支持设备端快速推理。
这是一个基于GLM-4.6模型转换的MLX格式版本,采用8位量化技术,分组大小为32,专为苹果芯片优化,提供高效的文本生成功能。
IBM Granite-4.0-H-Tiny模型的5-bit量化版本,专为苹果硅芯片优化。采用Mamba-2与软注意力混合架构,结合混合专家模型(MoE),在保持高质量的同时实现高效推理。
IBM Granite-4.0-H-Tiny是经过苹果硅芯片优化的混合Mamba-2/Transformer模型,采用3位量化技术,专为长上下文、高效推理和企业使用而设计。该模型结合了Mamba-2架构和专家混合技术,在保持表达能力的同时显著降低内存占用。
VGGT-MPS是基于苹果芯片优化的3D视觉重建工具,使用Metal Performance Shaders加速,能够从单张或多张图像生成深度图、相机姿态和3D点云,支持稀疏注意力实现城市级重建。
一个基于MLX Whisper的音频转录MCP服务,支持本地文件、Base64音频和YouTube视频转录,专为苹果M系列芯片优化。