マルチモーダル推論機能を備えた、効率的なオープンソースの専門家混合型ビジョン言語モデルです。
費用対効果の高い、強力な専門家混合型特性を備えた言語モデルです。
Openai
-
入力トークン/百万
出力トークン/百万
コンテキスト長
Alibaba
$2
256
Deepseek
$4
$12
128
32
$0.75
Chatglm
$8
Tencent
$0.5
224
$1
$3
4
Anthropic
$21
$105
200
$6
$6.4
$1.5
$1.6
28
Minimax
$16
1k
Baidu
64
Sensetime
$4.5
nvidia
Nemotron-Flash-3Bは、NVIDIAが開発した新しい混合型小型言語モデルで、実際のアプリケーションにおける低遅延のニーズに特化して設計されています。このモデルは、数学、コーディング、一般知識の推論などのタスクで卓越した性能を発揮し、小バッチでの低遅延と大バッチでの高スループットの特性を兼ね備えています。