AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
ZH

模型

查看更多

GLM 4.5 Air 3bit DWQ V2

mlx-community

G

基于智谱AI GLM-4.5-Air模型转换的3位深度量化权重(Deep Weight Quantization)版本,专为MLX框架优化,在保持较高性能的同时显著减少模型大小和推理资源需求

自然语言处理MlxMlx支持多种语言
mlx-community
174
1

Qwen3 0.6B 4bit DWQ 053125

mlx-community

Q

这是一个基于Qwen/Qwen3-0.6B模型转换而来的MLX格式版本,专为在Apple Silicon设备(如Mac)上高效运行而优化。它采用了4位DWQ(Dynamic Weight Quantization)量化技术,在保持良好性能的同时显著减少了模型大小和内存占用,适用于本地文本生成任务。

自然语言处理MlxMlx
mlx-community
335
1

Deepseek Llm 67b Chat AWQ

TheBloke

D

DeepSeek LLM 67B Chat AWQ是基于DeepSeek 670亿参数大语言模型的4位量化版本,采用AWQ(Activation-aware Weight Quantization)技术进行优化,在保持高质量的同时显著提升推理速度,支持中英文对话任务。

自然语言处理TransformersTransformers
TheBloke
1.4k
5
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商务合作网站地图