最高のFP8 AIツールモデル_厳選FP8情報 - AIBase

AIニュース

もっと見る

効率比が10倍に向上：アントグループの百靈大モデルLing-2.6-flashが正式にオープンソース化

蚂蚁集团の百灵大模型が本日、Ling-2.6-flashをオープンソース化し、BF16、FP8、INT4などの量子化バージョンを提供、AI導入のハードルを低減。総パラメータ104B、活性化パラメータ7.4Bで、匿名で国際評価プラットフォームで好成績を収め、中英切り替えとコード生成に多段階最適化を実施。....

13k 15 時間前

効率比が10倍に向上：アントグループの百靈大モデルLing-2.6-flashが正式にオープンソース化

アリババグループの百靈大モデルの新しいオープンソースメンバー：Ling-2.6-flashが正式にリリース

アントグループの百灵大モデルシリーズが更新され、Ling-2.6-flashが正式公開。総パラメータ数104B、活性化パラメータ7.4Bで、BF16、FP8、INT4等多精度バージョンを提供し、異なるハードウェア環境に対応し導入障壁を低減。以前は「Elephant Alpha」としてOpenRouterで匿名テストされていた。....

アリババグループの百靈大モデルの新しいオープンソースメンバー：Ling-2.6-flashが正式にリリース

中国の計算力が新しい突破を遂げました！モアーライン・スレッドとシルコン・フローがMTT S5000でDeepSeek V3 671Bフルバージョンの効率的な推論を実現し、1枚のカードの性能が国際的なトップレベルに近づいています

国産AIチップと大規模モデルの連携最適化で重要な進展。Moore Threadsと硅基流动が国産GPU MTT S5000を基に、千億パラメータモデルDeepSeek V3 671Bへの深い適配に成功。FP8低精度推論技術により、単一カードで事前入力処理能力は4000トークン/秒以上、デコード処理能力は1000トークン/秒以上を達成し、推論速度は国際的な主要高性能AIアクセラレータに迫る水準に。....

16.8k 3 時間前

中国の計算力が新しい突破を遂げました！モアーライン・スレッドとシルコン・フローがMTT S5000でDeepSeek V3 671Bフルバージョンの効率的な推論を実現し、1枚のカードの性能が国際的なトップレベルに近づいています

アントグループがトレーリオンパラメータモデルLing-1Tを発表し、GPT-5を上回り新たな基準となる

アントグループがFP8低精度訓練を採用した兆パラメータ大規模モデル「Ling-1T」をオープンソース化。Ling2.0ファミリーに属し、汎用タスクに特化した速度と効率が特徴。....

15k 5 時間前

アントグループがトレーリオンパラメータモデルLing-1Tを発表し、GPT-5を上回り新たな基準となる

AI製品

もっと見る

DeepGEMM

DeepGEMM

DeepGEMMは、効率的なFP8行列乗算のためのCUDAライブラリであり、細粒度スケーリングと様々な最適化技術をサポートしています。

開発とツール

モデル

もっと見る

wan2.5-t2v-preview

Alibaba

wan2.5-t2v-preview

-

入力トークン/百万

-

出力トークン/百万

-

コンテキスト長

Hunyuan-Large-Longcontext

Tencent

Hunyuan-Large-Longcontext

$6

入力トークン/百万

$18

出力トークン/百万

256

コンテキスト長

CogVideoX-Flash

Chatglm

CogVideoX-Flash

-

入力トークン/百万

-

出力トークン/百万

-

コンテキスト長

GLM-4-Flash

Chatglm

GLM-4-Flash

-

入力トークン/百万

-

出力トークン/百万

128

コンテキスト長

AIBase

未来を力づける、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

© 2026AIBase

ビジネス協力サイトマップ