Deepseek
$4
入力トークン/百万
$12
出力トークン/百万
128
コンテキスト長
$16
32
$2
$8
Alibaba
-
$1.6
$1
8
Tencent
$100
nvidia
NVIDIA DeepSeek R1 FP4 v2は、DeepSeek AIのDeepSeek R1モデルに基づいてFP4量子化を行ったテキスト生成モデルで、最適化されたTransformerアーキテクチャを採用しており、商用および非商用用途に使用できます。このモデルはTensorRT Model Optimizerを通じて量子化され、FP8バージョンと比較してディスク容量とGPUメモリの要件が大幅に削減されています。
Model Context Protocol (MCP)に基づくサーバーで、DeepSeek - R1の推論機能にアクセスでき、非推論モデルが強化された思考によってより良い応答を生成できるようにします。