AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
ZH

AI资讯

查看更多

Unsloth AI发布1.8bit量化Kimi K2模型,显著降低部署成本

Unsloth AI成功将Moonshot AI的Kimi K2模型量化为1.8bit版本,模型体积从1.1TB压缩至245GB,降幅达80%,同时保持全部性能。这款1万亿参数的开源大模型采用MoE架构,擅长代码生成和推理任务。量化后的版本可在512GB内存的M3Ultra设备上运行,大幅降低部署成本。该技术突破使Kimi K2成为GPT-4.1等商业模型的有力竞争者,为中小企业提供高性能AI解决方案。尽管商业化需遵守开源标注要求,但这一进展显著推动了开源AI生态发展,有望在教育、医疗等领域实现更广泛应用。

9.3k 22 小时前
Unsloth AI发布1.8bit量化Kimi K2模型,显著降低部署成本

中国AI黑马DeepSeek-V3震撼登场:20令牌/秒运行速度,能否改写AI格局?

中国人工智能初创公司DeepSeek悄然发布了大型语言模型DeepSeek-V3-0324,在人工智能行业引发了震动。该模型以641GB的体量现身于AI资源库Hugging Face,此次发布延续了DeepSeek低调却极具影响力的风格,没有大肆宣传,仅附带空的README文件和模型权重。这款模型采用MIT许可,可免费用于商业用途,且能在消费级硬件——配备M3Ultra芯片的苹果Mac Studio上直接运行。AI研究人员Awni Hannun在社交媒体透露,4位量化版本的DeepSeek-V3-0324在512GB的M3Ultra芯片上,运行速度超20令牌/秒。尽管Mac Studio价格高昂,但能在

18.1k 23 小时前
中国AI黑马DeepSeek-V3震撼登场:20令牌/秒运行速度,能否改写AI格局?
AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商务合作网站地图