寒武紀董事長陳天石在2025年度業績說明會上回應投資者,針對互聯網大廠自研芯片的競爭壓力,強調公司產品採用“通用型”設計,具備更強的普適性,能應對多樣化AI技術。他指出,大廠芯片多圍繞主營業務提供垂直解決方案,而寒武紀的通用架構更靈活,適應不同場景需求。
中國第三代自主超導量子計算機“本源悟空”已初步具備搭載AI的運算能力,標誌着國產量子算力開始系統性融入人工智能應用生態,開啓“量子+AI”協同發展新篇章。該計算機於2024年1月投入運行,搭載72位自主超導量子芯片“悟空芯”,此次技術升級不僅是計算能力的提升,更是量子計算與人工智能融合的重要里程碑。
華爲4月20日發佈Pura90系列、Pura X Max摺疊手機及首款鴻蒙AI眼鏡,並公佈價格。儘管存儲芯片漲價,華爲仍保持穩定定價策略,Pura90標準版起售價與上代持平,展現市場競爭力。
2026年春季招聘數據顯示,新興生產力行業人才需求激增。人工智能工程師最爲搶手,平均月薪達20804元,崗位缺口持續擴大。機器人、新材料行業招聘崗位同比增長超30%,光電子、人工智能、航空航天等領域增長也接近或超過20%。薪資方面,人工智能工程師月薪領先,芯片工程師緊隨其後。
iPhone 16e:最新iPhone,價格親民,性能卓越,配備A18芯片和48MP融合相機。
全球首款基於拓撲核心架構的量子芯片,為量子計算開闢新路徑。
FlagCX是一個跨芯片通信庫。
開源AI芯片性能基準測試平臺
Tencent
$3
輸入tokens/百萬
$9
輸出tokens/百萬
16
上下文長度
Baidu
-
32
$0.1
$0.4
128
Chatglm
$100
kyr0
這是一個專為蘋果硅芯片設備優化的自動語音識別模型,通過轉換為MLX框架並量化為FP8格式,實現在蘋果設備上的快速端上語音轉錄。該模型針對逐字精度進行微調,特別適用於需要高精度轉錄的場景。
mlx-community
VibeThinker-1.5B的4位量化版本,基於MLX框架針對蘋果芯片優化,是一個擁有15億參數的密集語言模型,專門用於數學推理和算法編碼問題
lmstudio-community
Qwen3-VL-2B-Thinking是由Qwen推出的視覺語言模型,基於2B參數規模,使用MLX進行8位量化,專門針對Apple Silicon芯片進行了優化。該模型支持圖像和文本的多模態理解與生成任務。
Granite-4.0-H-1B-8bit 是 IBM Granite 系列的小型語言模型,專門針對 Apple Silicon 芯片優化,採用 8 位量化技術,參數量為 1B,具有高效推理和低資源消耗的特點。
MiniMax-M2-4bit 是使用 mlx-lm 工具從 MiniMaxAI/MiniMax-M2 轉換而來的 4 位量化版本,專門針對 Apple Silicon 芯片優化,提供高效的文本生成能力。
DeepSeek-OCR-8bit是基於DeepSeek-OCR模型轉換的MLX格式版本,專門針對蘋果芯片優化的視覺語言模型,支持多語言OCR識別和圖像文本理解任務。
DeepSeek-OCR-6bit是基於DeepSeek-OCR模型轉換的MLX格式版本,專門針對蘋果芯片優化。這是一個視覺語言模型,具備強大的光學字符識別能力,能夠從圖像中提取和識別文本信息。
Wwayu
這是一個基於GLM-4.6架構的混合專家模型,使用REAP方法對專家進行了40%的均勻剪枝,參數量為218B,並轉換為MLX格式的3位量化版本,適用於蘋果芯片設備高效運行。
Qwen3-VL-32B-Instruct是一個強大的多模態視覺語言模型,基於Qwen基礎模型開發,經過優化和量化處理,專門針對蘋果芯片設備進行了優化,提供高效的圖像文本處理能力。
Qwen3-VL-2B-Instruct 是一款高效的圖像文本轉文本模型,由 Qwen 團隊開發。該模型經過 MLX 8位量化優化,特別適用於蘋果硅芯片設備,能夠處理視覺語言任務並提供高效的解決方案。
manasmisra
該模型是基於GLM-4.5-Air使用REAP方法進行25%均勻剪枝後的專家混合模型,已轉換為MLX格式的4位量化版本,適用於蘋果芯片設備的高效推理。
nightmedia
這是一個基於Qwen3-Coder-REAP-25B-A3B模型轉換的MLX格式版本,使用mlx-lm工具從原始模型轉換而來,專門針對Apple Silicon芯片優化,支持高效的文本生成任務。
這是Qwen3-VL-4B-Instruct模型的4位量化版本,專門針對Apple Silicon芯片優化,使用MLX框架轉換。該模型是一個視覺語言模型,支持圖像理解和多模態對話任務。
Qwen3-VL-8B-Instruct是由Qwen團隊開發的多模態視覺語言模型,支持圖像文本到文本轉換。該版本經過MLX 8位量化處理,專門針對蘋果硅芯片進行優化,在保持性能的同時提升運行效率。
LFM2-8B-A1B是針對蘋果硅芯片優化的8位量化MLX構建版本,採用專家混合(MoE)架構,總參數約80億,每個令牌激活約10億參數,支持設備端快速推理。
這是一個基於GLM-4.6模型轉換的MLX格式版本,採用8位量化技術,分組大小為32,專為蘋果芯片優化,提供高效的文本生成功能。
IBM Granite-4.0-H-Tiny模型的5-bit量化版本,專為蘋果硅芯片優化。採用Mamba-2與軟注意力混合架構,結合混合專家模型(MoE),在保持高質量的同時實現高效推理。
IBM Granite-4.0-H-Tiny是經過蘋果硅芯片優化的混合Mamba-2/Transformer模型,採用3位量化技術,專為長上下文、高效推理和企業使用而設計。該模型結合了Mamba-2架構和專家混合技術,在保持表達能力的同時顯著降低內存佔用。
Apriel-1.5-15B-Thinker是一個專為圖像理解與推理設計的150億參數多模態模型,採用中期訓練方法而非RLHF訓練。本版本為適用於蘋果芯片的MLX量化版本,具有內存佔用小、啟動速度快的特點。
KAT-Dev是由Kwaipilot開發的多語言自然語言處理模型,支持多種語言交互任務,提供高效準確的語言處理能力。該版本經過MLX團隊8位量化優化,專門針對蘋果硅芯片進行了性能優化。
一個基於MLX Whisper的音頻轉錄MCP服務,支持本地文件、Base64音頻和YouTube視頻轉錄,專為蘋果M系列芯片優化。
VGGT-MPS是基於蘋果芯片優化的3D視覺重建工具,使用Metal Performance Shaders加速,能夠從單張或多張圖像生成深度圖、相機姿態和3D點雲,支持稀疏注意力實現城市級重建。