Deepseek
$4
輸入tokens/百萬
$12
輸出tokens/百萬
128
上下文長度
$16
32
$2
$8
-
8
$1
nvidia
NVIDIA DeepSeek R1 FP4 v2是基於DeepSeek AI的DeepSeek R1模型進行FP4量化的文本生成模型,採用優化的Transformer架構,可用於商業和非商業用途。該模型通過TensorRT Model Optimizer進行量化,相比FP8版本顯著減少了磁盤大小和GPU內存需求。