2026年2月,中國人工智能產業發展聯盟第十六次全會召開,強調將製造業作爲AI賦能主戰場,全力推進“人工智能+製造”向深層次發展。工信部明確四項關鍵發力點:構建智能化工業體系,重點突破算力芯片、工業大模型等核心技術,以全面提升產業競爭力。
人工智能產業爆發式增長衝擊消費電子供應鏈,蘋果公司受影響顯著。內存芯片價格飆升,DRAM年底或較去年翻兩番,NAND閃存價格激增三倍以上,成本壓力將體現在秋季發佈的入門級iPhone18上。
OpenAI正尋求英偉達之外的AI算力替代方案,因其對英偉達最新芯片在推理環節的響應速度不滿。公司發現,在代碼生成等複雜交互中,硬件速度已成瓶頸,因此戰略重心正從模型訓練轉向推理優化。
OpenAI計劃融資1000億美元以支持AI業務發展,英偉達考慮追加投資300億美元。作爲關鍵芯片供應商,英偉達的算力是OpenAI模型訓練的核心支撐。
iPhone 16e:最新iPhone,價格親民,性能卓越,配備A18芯片和48MP融合相機。
全球首款基於拓撲核心架構的量子芯片,為量子計算開闢新路徑。
FlagCX是一個跨芯片通信庫。
開源AI芯片性能基準測試平臺
Tencent
$3
輸入tokens/百萬
$9
輸出tokens/百萬
16
上下文長度
Baidu
-
32
$0.1
$0.4
128
Chatglm
$100
kyr0
這是一個專為蘋果硅芯片設備優化的自動語音識別模型,通過轉換為MLX框架並量化為FP8格式,實現在蘋果設備上的快速端上語音轉錄。該模型針對逐字精度進行微調,特別適用於需要高精度轉錄的場景。
mlx-community
VibeThinker-1.5B的4位量化版本,基於MLX框架針對蘋果芯片優化,是一個擁有15億參數的密集語言模型,專門用於數學推理和算法編碼問題
lmstudio-community
Qwen3-VL-2B-Thinking是由Qwen推出的視覺語言模型,基於2B參數規模,使用MLX進行8位量化,專門針對Apple Silicon芯片進行了優化。該模型支持圖像和文本的多模態理解與生成任務。
Granite-4.0-H-1B-8bit 是 IBM Granite 系列的小型語言模型,專門針對 Apple Silicon 芯片優化,採用 8 位量化技術,參數量為 1B,具有高效推理和低資源消耗的特點。
MiniMax-M2-4bit 是使用 mlx-lm 工具從 MiniMaxAI/MiniMax-M2 轉換而來的 4 位量化版本,專門針對 Apple Silicon 芯片優化,提供高效的文本生成能力。
DeepSeek-OCR-8bit是基於DeepSeek-OCR模型轉換的MLX格式版本,專門針對蘋果芯片優化的視覺語言模型,支持多語言OCR識別和圖像文本理解任務。
DeepSeek-OCR-6bit是基於DeepSeek-OCR模型轉換的MLX格式版本,專門針對蘋果芯片優化。這是一個視覺語言模型,具備強大的光學字符識別能力,能夠從圖像中提取和識別文本信息。
Wwayu
這是一個基於GLM-4.6架構的混合專家模型,使用REAP方法對專家進行了40%的均勻剪枝,參數量為218B,並轉換為MLX格式的3位量化版本,適用於蘋果芯片設備高效運行。
Qwen3-VL-32B-Instruct是一個強大的多模態視覺語言模型,基於Qwen基礎模型開發,經過優化和量化處理,專門針對蘋果芯片設備進行了優化,提供高效的圖像文本處理能力。
Qwen3-VL-2B-Instruct 是一款高效的圖像文本轉文本模型,由 Qwen 團隊開發。該模型經過 MLX 8位量化優化,特別適用於蘋果硅芯片設備,能夠處理視覺語言任務並提供高效的解決方案。
manasmisra
該模型是基於GLM-4.5-Air使用REAP方法進行25%均勻剪枝後的專家混合模型,已轉換為MLX格式的4位量化版本,適用於蘋果芯片設備的高效推理。
nightmedia
這是一個基於Qwen3-Coder-REAP-25B-A3B模型轉換的MLX格式版本,使用mlx-lm工具從原始模型轉換而來,專門針對Apple Silicon芯片優化,支持高效的文本生成任務。
這是Qwen3-VL-4B-Instruct模型的4位量化版本,專門針對Apple Silicon芯片優化,使用MLX框架轉換。該模型是一個視覺語言模型,支持圖像理解和多模態對話任務。
Qwen3-VL-8B-Instruct是由Qwen團隊開發的多模態視覺語言模型,支持圖像文本到文本轉換。該版本經過MLX 8位量化處理,專門針對蘋果硅芯片進行優化,在保持性能的同時提升運行效率。
LFM2-8B-A1B是針對蘋果硅芯片優化的8位量化MLX構建版本,採用專家混合(MoE)架構,總參數約80億,每個令牌激活約10億參數,支持設備端快速推理。
這是一個基於GLM-4.6模型轉換的MLX格式版本,採用8位量化技術,分組大小為32,專為蘋果芯片優化,提供高效的文本生成功能。
IBM Granite-4.0-H-Tiny模型的5-bit量化版本,專為蘋果硅芯片優化。採用Mamba-2與軟注意力混合架構,結合混合專家模型(MoE),在保持高質量的同時實現高效推理。
IBM Granite-4.0-H-Tiny是經過蘋果硅芯片優化的混合Mamba-2/Transformer模型,採用3位量化技術,專為長上下文、高效推理和企業使用而設計。該模型結合了Mamba-2架構和專家混合技術,在保持表達能力的同時顯著降低內存佔用。
Apriel-1.5-15B-Thinker是一個專為圖像理解與推理設計的150億參數多模態模型,採用中期訓練方法而非RLHF訓練。本版本為適用於蘋果芯片的MLX量化版本,具有內存佔用小、啟動速度快的特點。
KAT-Dev是由Kwaipilot開發的多語言自然語言處理模型,支持多種語言交互任務,提供高效準確的語言處理能力。該版本經過MLX團隊8位量化優化,專門針對蘋果硅芯片進行了性能優化。
一個基於MLX Whisper的音頻轉錄MCP服務,支持本地文件、Base64音頻和YouTube視頻轉錄,專為蘋果M系列芯片優化。
VGGT-MPS是基於蘋果芯片優化的3D視覺重建工具,使用Metal Performance Shaders加速,能夠從單張或多張圖像生成深度圖、相機姿態和3D點雲,支持稀疏注意力實現城市級重建。