最好的FP8 AI工具模型_精選FP8資訊 - AIBase

AI資訊

智效比提升十倍：螞蟻集團百靈大模型Ling-2.6-flash正式開源

螞蟻集團百靈大模型今日開源Ling-2.6-flash，推出BF16、FP8、INT4等多量化版本，降低AI部署門檻。該模型總參數104B，激活參數7.4B，此前以匿名身份在國際評測平臺表現優異，並針對中英文切換與代碼生成完成多輪優化。

智效比提升十倍：螞蟻集團百靈大模型Ling-2.6-flash正式開源

螞蟻集團百靈大模型系列更新 Ling-2.6-flash正式開源

螞蟻集團百靈大模型系列更新，Ling-2.6-flash正式開放。該模型總參數104B，激活參數7.4B，提供BF16、FP8、INT4等多精度版本，適配不同硬件環境並降低部署門檻。此前以“Elephant Alpha”匿名在OpenRouter平臺測試。

螞蟻集團百靈大模型系列更新 Ling-2.6-flash正式開源

國產算力新突破！摩爾線程×硅基流動在MTT S5000上實現DeepSeek V3 671B滿血版高效推理，單卡性能逼近國際頂尖水平

國產AI芯片與大模型協同優化取得重要進展。摩爾線程與硅基流動基於國產GPU MTT S5000，成功完成對千億參數大模型DeepSeek V3 671B的深度適配。通過應用FP8低精度推理技術，實現單卡預填充吞吐量超4000 tokens/秒，解碼吞吐量超1000 tokens/秒，推理速度已接近國際主流高端AI加速器水平。

14.8k 9 小時前

國產算力新突破！摩爾線程×硅基流動在MTT S5000上實現DeepSeek V3 671B滿血版高效推理，單卡性能逼近國際頂尖水平

螞蟻集團發佈萬億參數模型 Ling-1T，超越 GPT-5 成新標杆

螞蟻集團開源萬億參數大模型Ling-1T，採用FP8低精度訓練，爲當前最大基座模型。該模型由"百靈"團隊開發，屬於Ling2.0家族，包含Ling、Ring、Ming三大系列。其中Ling系列專注通用任務，強調速度與效率優勢。

13.6k 5 小時前

螞蟻集團發佈萬億參數模型 Ling-1T，超越 GPT-5 成新標杆

AI產品

DeepGEMM

DeepGEMM

DeepGEMM是一個用於高效FP8矩陣乘法的CUDA庫，支持細粒度縮放和多種優化技術。

開發與工具

模型

wan2.5-t2v-preview

Alibaba

wan2.5-t2v-preview

-

輸入tokens/百萬

-

輸出tokens/百萬

-

上下文長度

Hunyuan-Large-Longcontext

Tencent

Hunyuan-Large-Longcontext

$6

輸入tokens/百萬

$18

輸出tokens/百萬

256

上下文長度

CogVideoX-Flash

Chatglm

CogVideoX-Flash

-

輸入tokens/百萬

-

輸出tokens/百萬

-

上下文長度

GLM-4-Flash

Chatglm

GLM-4-Flash

-

輸入tokens/百萬

-

輸出tokens/百萬

128

上下文長度

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

商務合作網站地圖