AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

華爲推新技術優化大模型推理:UCM 技術緩解 HBM 依賴

8月12日,華爲將在 2025金融AI推理應用落地與發展論壇 上發佈突破性 AI 推理創新技術 UCM(推理記憶數據管理器)。該技術有望降低中國 AI 推理對 HBM(高帶寬內存)的依賴,並顯著提升國內大模型推理性能。UCM 以 KV Cache 爲核心,融合多類型緩存加速算法工具,通過分級管理推理過程中產生的記憶數據,擴大上下文窗口,實現高吞吐、低時延的推理體驗,並降低每 Token 的推理成本。這一方案可緩解 HBM 資源不足帶來的任務卡頓與響應延遲問題。在此次論壇上,華爲將與中國銀聯共同發佈 AI

9.3k 12-11
華爲推新技術優化大模型推理:UCM 技術緩解 HBM 依賴

模型

查看更多

Ucmt_sam_on_depth

weihao1115

U

基於PyTorch實現的掩碼生成模型,通過PytorchModelHubMixin集成推送至Hub

計算機視覺SafetensorsSafetensors
weihao1115
35
1
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖