AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
ZH

模型

查看更多

Google Gemma 2b AWQ 4bit Smashed

PrunaAI

G

基于google/gemma-2b模型通过AWQ技术压缩的4位量化版本,旨在提升推理效率并降低资源消耗。

自然语言处理TransformersTransformers
PrunaAI
33
1

Universal NER UniNER 7B All Bnb 4bit Smashed

PrunaAI

U

PrunaAI提供的压缩版UniNER-7B-all模型,通过量化技术显著减少内存占用和能耗,同时保持较好的命名实体识别能力。

自然语言处理TransformersTransformers
PrunaAI
22
1

Writer Palmyra Small Bnb 8bit Smashed

PrunaAI

W

PrunaAI优化的8位量化版Palmyra小型语言模型,显著降低内存占用和能耗

自然语言处理TransformersTransformers
PrunaAI
31
1

Mosaicml Mpt 7b Storywriter Bnb 4bit Smashed

PrunaAI

M

PrunaAI压缩的MPT-7B故事写作模型,通过llm-int8技术实现高效推理

自然语言处理TransformersTransformers其他
PrunaAI
27
1

Mosaicml Mpt 7b Chat Bnb 4bit Smashed

PrunaAI

M

PrunaAI提供的压缩版MPT-7B-Chat模型,通过llm-int8技术优化,显著降低内存占用和能耗。

自然语言处理TransformersTransformers其他
PrunaAI
30
1
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商务合作网站地图