taobao-mnn
Qwen3-VL-8B-Thinking-MNN是基于Qwen3-VL-8B-Thinking导出的MNN模型的4位量化版本,专为文本生成和聊天场景优化,支持视觉语言理解任务
基于gpt-oss-20b模型导出的MNN模型的4位量化版本,专为文本生成任务优化,支持聊天等应用场景,具有高效的推理性能和较低的内存占用
这是DeepSeek-R1-0528-Qwen3-8B模型的MNN格式4位量化版本,专为高效推理优化。基于Qwen3-8B架构,支持文本生成和对话功能,适用于资源受限环境。
FastVLM-1.5B-Stage3-MNN是基于Transformer架构的文本生成模型,是FastVLM-1.5B-Stage3的8位量化版本,适用于聊天等文本生成场景。
基于Qwen3-30B-A3B导出的MNN模型,经过4位量化后的版本,适用于高效推理。
基于Qwen2.5-Omni-3B导出的MNN模型4位量化版本,通过llmexport工具实现,提供高效的推理性能
Qwen3-4B的MNN模型4位量化版本,用于高效文本生成任务
基于InternVL2_5-1B的4位量化版本,适用于文本生成和聊天场景
基于Qwen2.5-Omni-7B导出的MNN模型的4位量化版本,专为文本生成和聊天场景优化,具有高效的推理性能。
Qwen2-0.5B-Instruct-MNN是基于Qwen2-0.5B-Instruct导出的MNN模型的4位量化版本,适用于文本生成和聊天场景。
基于Qwen2.5-0.5B-Instruct通过llmexport工具导出的MNN模型的4位量化版本,专为文本生成和聊天场景优化,具有轻量化和高效推理的特点。