北大与DeepSeek联合开源大模型推理加速框架DSpark,针对自回归生成中每词元均需全算力导致的高并发延迟与算力浪费,提供突破性解决方案。
Iflytek
$2
输入tokens/百万
-
输出tokens/百万
上下文长度
8
$8