AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
數據集市
TW

AI資訊

查看更多

DeepSeek開源周第3天:發佈DeepGEMM,FP8 GEMM庫助力AI訓練與推理

中國人工智能公司DeepSeek在其“開源周”第3天宣佈推出DeepGEMM——一款支持FP8通用矩陣乘法(GEMM)的開源庫。這一工具專爲密集型和混合專家(MoE)矩陣運算設計,爲DeepSeek V3和R1模型的訓練與推理提供強大支持。官方消息通過X平臺發佈,迅速引發技術社區的熱烈反響。據DeepSeek官方賬號發佈的帖子,DeepGEMM在NVIDIA Hopper GPU上可實現高達1350+ TFLOPS的FP8計算性能。其核心邏輯僅約300行代碼,卻能在大多數矩陣尺寸上超越專家調優的內核,展現了極高的效率和簡潔性。該庫無需複雜依賴,採用即時編

18.7k 1 天前
DeepSeek開源周第3天:發佈DeepGEMM,FP8 GEMM庫助力AI訓練與推理

AI產品

查看更多
DeepGEMM

DeepGEMM

DeepGEMM是一個用於高效FP8矩陣乘法的CUDA庫,支持細粒度縮放和多種優化技術。

開發與工具
8.4k
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商務合作網站地圖