Nvidia发布小型语言模型Nemotron-Nano-9B-v2,拥有9亿参数,较原版12亿大幅缩减,旨在单台A10GPU高效运行。该模型采用混合架构,适应实际部署需求,推动小型模型发展。
Nvidia发布小型语言模型Nemotron-Nano-9B-v2,参数量90亿,较前代减少30亿,专为单个A10GPU优化。该模型在基准测试中表现优异,支持灵活控制推理功能,处理速度提升高达6倍,适用于多种应用场景。