最好的FP8 AI工具模型_精选FP8资讯 - AIBase

AI资讯

智效比提升十倍：蚂蚁集团百灵大模型Ling-2.6-flash正式开源

蚂蚁集团百灵大模型今日开源Ling-2.6-flash，推出BF16、FP8、INT4等多量化版本，降低AI部署门槛。该模型总参数104B，激活参数7.4B，此前以匿名身份在国际评测平台表现优异，并针对中英文切换与代码生成完成多轮优化。

智效比提升十倍：蚂蚁集团百灵大模型Ling-2.6-flash正式开源

蚂蚁集团百灵大模型系列更新 Ling-2.6-flash正式开源

蚂蚁集团百灵大模型系列更新，Ling-2.6-flash正式开放。该模型总参数104B，激活参数7.4B，提供BF16、FP8、INT4等多精度版本，适配不同硬件环境并降低部署门槛。此前以“Elephant Alpha”匿名在OpenRouter平台测试。

蚂蚁集团百灵大模型系列更新 Ling-2.6-flash正式开源

国产算力新突破！摩尔线程×硅基流动在MTT S5000上实现DeepSeek V3 671B满血版高效推理，单卡性能逼近国际顶尖水平

国产AI芯片与大模型协同优化取得重要进展。摩尔线程与硅基流动基于国产GPU MTT S5000，成功完成对千亿参数大模型DeepSeek V3 671B的深度适配。通过应用FP8低精度推理技术，实现单卡预填充吞吐量超4000 tokens/秒，解码吞吐量超1000 tokens/秒，推理速度已接近国际主流高端AI加速器水平。

15.9k 14 小时前

国产算力新突破！摩尔线程×硅基流动在MTT S5000上实现DeepSeek V3 671B满血版高效推理，单卡性能逼近国际顶尖水平

蚂蚁集团发布万亿参数模型 Ling-1T，超越 GPT-5 成新标杆

蚂蚁集团开源万亿参数大模型Ling-1T，采用FP8低精度训练，为当前最大基座模型。该模型由"百灵"团队开发，属于Ling2.0家族，包含Ling、Ring、Ming三大系列。其中Ling系列专注通用任务，强调速度与效率优势。

蚂蚁集团发布万亿参数模型 Ling-1T，超越 GPT-5 成新标杆

AI产品

DeepGEMM

DeepGEMM

DeepGEMM是一个用于高效FP8矩阵乘法的CUDA库，支持细粒度缩放和多种优化技术。

开发与工具

模型

wan2.5-t2v-preview

Alibaba

wan2.5-t2v-preview

-

输入tokens/百万

-

输出tokens/百万

-

上下文长度

Hunyuan-Large-Longcontext

Tencent

Hunyuan-Large-Longcontext

$6

输入tokens/百万

$18

输出tokens/百万

256

上下文长度

CogVideoX-Flash

Chatglm

CogVideoX-Flash

-

输入tokens/百万

-

输出tokens/百万

-

上下文长度

GLM-4-Flash

Chatglm

GLM-4-Flash

-

输入tokens/百万

-

输出tokens/百万

128

上下文长度

AIBase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

商务合作网站地图