北大與DeepSeek聯合開源大模型推理加速框架DSpark,針對自迴歸生成中每詞元均需全算力導致的高併發延遲與算力浪費,提供突破性解決方案。
Iflytek
$2
輸入tokens/百萬
-
輸出tokens/百萬
上下文長度
8
$8