AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

Unsloth AI發佈1.8bit量化Kimi K2模型,顯著降低部署成本

Unsloth AI成功將Moonshot AI的Kimi K2模型量化爲1.8bit版本,模型體積從1.1TB壓縮至245GB,降幅達80%,同時保持全部性能。這款1萬億參數的開源大模型採用MoE架構,擅長代碼生成和推理任務。量化後的版本可在512GB內存的M3Ultra設備上運行,大幅降低部署成本。該技術突破使Kimi K2成爲GPT-4.1等商業模型的有力競爭者,爲中小企業提供高性能AI解決方案。儘管商業化需遵守開源標註要求,但這一進展顯著推動了開源AI生態發展,有望在教育、醫療等領域實現更廣泛應用。

9.3k 22 小時前
Unsloth AI發佈1.8bit量化Kimi K2模型,顯著降低部署成本

中國AI黑馬DeepSeek-V3震撼登場:20令牌/秒運行速度,能否改寫AI格局?

中國人工智能初創公司DeepSeek悄然發佈了大型語言模型DeepSeek-V3-0324,在人工智能行業引發了震動。該模型以641GB的體量現身於AI資源庫Hugging Face,此次發佈延續了DeepSeek低調卻極具影響力的風格,沒有大肆宣傳,僅附帶空的README文件和模型權重。這款模型採用MIT許可,可免費用於商業用途,且能在消費級硬件——配備M3Ultra芯片的蘋果Mac Studio上直接運行。AI研究人員Awni Hannun在社交媒體透露,4位量化版本的DeepSeek-V3-0324在512GB的M3Ultra芯片上,運行速度超20令牌/秒。儘管Mac Studio價格高昂,但能在

18.1k 23 小時前
中國AI黑馬DeepSeek-V3震撼登場:20令牌/秒運行速度,能否改寫AI格局?
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖