最好的Quantization AI工具模型_精選Quantization資訊 - AIBase

模型

GLM 4.5 Air 3bit DWQ V2

mlx-community

基於智譜AI GLM-4.5-Air模型轉換的3位深度量化權重(Deep Weight Quantization)版本，專為MLX框架優化，在保持較高性能的同時顯著減少模型大小和推理資源需求

自然語言處理

Mlx

Deepseek Llm 67b Chat AWQ

TheBloke

DeepSeek LLM 67B Chat AWQ是基於DeepSeek 670億參數大語言模型的4位量化版本，採用AWQ（Activation-aware Weight Quantization）技術進行優化，在保持高質量的同時顯著提升推理速度，支持中英文對話任務。

自然語言處理

Transformers

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

商務合作網站地圖