NVIDIA、汎用大規模言語モデルNemotron-4を発表

NVIDIAは、パラメータ数150億個の汎用大規模言語モデル「Nemotron-4」を発表しました。これは、多言語処理やコーディングタスクにおいて優れた性能を発揮します。

Chinchillaモデルのスケーリング則を採用することで、計算コスト、データ量、モデルサイズを最適化し、同規模のパラメータを持つ他のモデルを凌駕する、最強の汎用言語モデルとなっています。

Nemotron-4は、単一のA100またはH100 GPU上で動作することを目指しており、大規模言語モデル分野における新たな基準を打ち立てます。