北京大学とDeepSeekが共同で、大規模モデルの推論速度向上を目的としたオープンソースフレームワークDSparkを公開しました。自己回帰生成において各単語ごとにすべての計算能力が必要となることによる高同時接続遅延と計算能力の浪費を解決する画期的なソリューションを提供します。
Iflytek
$2
入力トークン/百万
-
出力トークン/百万
コンテキスト長
8
$8