mlx-community
基於智譜AI GLM-4.5-Air模型轉換的3位深度量化權重(Deep Weight Quantization)版本,專為MLX框架優化,在保持較高性能的同時顯著減少模型大小和推理資源需求
TheBloke
DeepSeek LLM 67B Chat AWQ是基於DeepSeek 670億參數大語言模型的4位量化版本,採用AWQ(Activation-aware Weight Quantization)技術進行優化,在保持高質量的同時顯著提升推理速度,支持中英文對話任務。