最好的'Nvidia' AI工具模型_精选'Nvidia'资讯

AI资讯

估值飙升至 230 亿美元！Cerebras 携手 OpenAI 挑战 NVIDIA 算力霸权

加州芯片公司Cerebras Systems完成10亿美元融资，估值达230亿美元，一年内增长近三倍。其独创的晶圆级引擎技术突破传统芯片架构，获得硅谷风投Benchmark Capital领投，显示市场对非GPU算力路线的看好。

8.5k 5 分钟前

面壁智能首推“松果派”：AI原生端侧开发板开启硬件开发新范式

面壁智能发布首款AI端侧开发板“松果派”，基于NVIDIA Jetson模组，集成麦克风、摄像头等多模态接口，适配自研MiniCPM系列模型，旨在让开发者便捷构建智能硬件。

12.5k 27 分钟前

Nvidia 推出新一代 Rubin 芯片架构，全面提升 AI 计算能力

英伟达CEO黄仁勋在CES上发布全新Rubin计算架构，称其为AI硬件尖端产品。该架构已投入生产，下半年将加速推广，旨在应对AI计算需求激增的挑战。

9.3k 4 小时前

NVIDIA 发布 NitroGen：开创游戏代理的视觉行动基础模型

NVIDIA推出NitroGen通用游戏AI模型，通过4万小时游戏视频学习，覆盖千款游戏，支持画面与手柄操作识别，提供开放数据集和预训练策略。

12.6k 3 天前

AI产品

GeForce RTX 5070 Ti

NVIDIA GeForce RTX 5070 Ti显卡，采用Blackwell架构，支持DLSS 4技术，为游戏和创作带来强大性能。

GPU

10.2k

PDF to Podcast Blueprint by NVIDIA

将PDF转换为音频内容，打造个性化的AI有声读物。

文本转声音

GeForce RTX 5090

NVIDIA® GeForce RTX™ 5090是迄今为止最强大的GeForce GPU，为游戏玩家和创作者带来变革性能力。

GPU

9.1k

NVIDIA-Ingest

NVIDIA-Ingest是用于文档内容和元数据提取的微服务。

开发与工具

10.4k

模型

Chronoedit

kayte0342

ChronoEdit-14B是NVIDIA开发的一款具备时间推理能力的图像编辑和世界模拟模型，拥有140亿参数。它通过两阶段推理过程实现物理感知的图像编辑和基于动作条件的世界模拟，从预训练视频生成模型中提炼先验知识。

NVIDIA Nemotron Parse V1.1 TC

nvidia

NVIDIA Nemotron Parse v1.1 TC 是一款先进的文档语义理解模型，能够从图像中提取具有空间定位的文本和表格元素，生成结构化注释，包括格式化文本、边界框和语义类别。相比前一版本，速度提升20%，并保留无序元素的页面顺序。

NVIDIA Nemotron Parse V1.1

nvidia

NVIDIA Nemotron Parse v1.1 是一款先进的文档解析模型，专门用于理解文档语义并提取具有空间定位的文本和表格元素。它能够将非结构化文档转换为机器可读的结构化表示，克服了传统OCR在处理复杂文档布局时的局限性。

NV Reason CXR 3B GGUF

samwell

NV-Reason-CXR-3B GGUF是NVIDIA NV-Reason-CXR-3B视觉语言模型的量化版本，专为边缘设备部署优化。这是一个30亿参数的模型，专注于胸部X光分析，已转换为GGUF格式并进行量化处理，可在移动设备、桌面设备和嵌入式系统上高效运行。

Nvidia.Qwen3 Nemotron 32B GenRM Principle GGUF

DevQuasar

这是NVIDIA基于Qwen3架构开发的32B参数奖励模型，专门用于强化学习中的奖励评分和原则对齐，帮助训练更安全、更符合人类价值观的AI系统。

Nvidia_Qwen3 Nemotron 32B RLBFF GGUF

bartowski

这是英伟达Qwen3-Nemotron-32B-RLBFF大语言模型的GGUF量化版本，使用llama.cpp工具进行多种精度量化，提供从BF16到IQ2_XXS共20多种量化选项，适用于不同硬件配置和性能需求。

ChronoEdit 14B GGUF

QuantStack

这是NVIDIA ChronoEdit-14B-Diffusers模型的GGUF量化版本，专门用于图像转视频任务。该模型保留了原始模型的所有功能，同时通过GGUF格式优化了部署和运行效率。

计算机视觉

Gguf

QuantStack

Qwen3 VL 2B Thinking GGUF

Qwen

Qwen3-VL-2B-Thinking是Qwen系列中最强大的视觉语言模型之一，采用GGUF格式权重，支持在CPU、NVIDIA GPU、Apple Silicon等设备上进行高效推理。该模型具备出色的多模态理解和推理能力，特别增强了视觉感知、空间理解和智能体交互功能。

Thewhisper Large V3

TheStageAI

TheWhisper-Large-V3是OpenAI Whisper Large V3模型的高性能微调版本，由TheStage AI针对多平台（NVIDIA GPU和Apple Silicon）的实时、低延迟和低功耗语音转文本推理进行了优化。

NVIDIA Nemotron Nano 12B V2 VL NVFP4 QAD

nvidia

NVIDIA-Nemotron-Nano-VL-12B-V2-FP4-QAD 是 NVIDIA 推出的自回归视觉语言模型，基于优化的 Transformer 架构，能够同时处理图像和文本输入。该模型采用 FP4 量化技术，在保持性能的同时显著减少模型大小和推理成本，适用于多种多模态应用场景。

NVIDIA Nemotron Nano 12B V2 VL FP8

nvidia

NVIDIA-Nemotron-Nano-VL-12B-V2-FP8 是 NVIDIA 推出的量化视觉语言模型，采用优化的 Transformer 架构，在商业图像上进行了三阶段训练。该模型支持单图像推理，具备多语言和多模态处理能力，适用于图像总结、文本图像分析等多种场景。

Qwen3 Nemotron 8B BRRM

nvidia

BR-RM是一种创新的两轮推理奖励模型，通过自适应分支和基于分支的反思机制，解决了传统奖励模型中的'判断扩散'问题，在多个奖励建模基准测试中取得了业界领先的性能。

NVIDIA Nemotron Nano 12B V2 VL BF16

nvidia

NVIDIA Nemotron Nano v2 12B VL是一款强大的多模态视觉语言模型，支持多图像推理和视频理解，具备文档智能、视觉问答和摘要功能，可用于商业用途。

GR00T N1.5 3B LIBERO LONG

Tacoin

这是Tacoin基于NVIDIA GR00T模型在LIBERO libero long基准测试上进行微调的机器人操作模型。该模型采用双RGB流和8自由度状态输入，能够预测16步关节空间动作，专门用于长视野机器人操作任务。

Llama Nemotron Rerank 1b V2

nvidia

Llama Nemotron Reranking 1B是NVIDIA开发的专门用于文本检索重排序的模型，基于Llama-3.2-1B架构微调，能够为查询-文档对提供相关性对数得分，支持多语言和长文档处理。

Llama Nemotron Embed 1b V2

nvidia

Llama Nemotron Embedding 1B模型是NVIDIA开发的专为多语言和跨语言文本问答检索优化的嵌入模型，支持26种语言，能够处理长达8192个标记的文档，并可通过动态嵌入大小大幅减少数据存储占用。

自然语言处理

Transformers其他

nvidia

Nemotron Flash 3B Instruct

nvidia

Nemotron-Flash-3B 是英伟达推出的新型混合小型语言模型，专门针对实际应用中的低延迟需求设计。该模型在数学、编码和常识推理等任务中展现出卓越性能，同时具备出色的小批量低延迟和大批量高吞吐量特性。

Qwen3 Nemotron 32B RLBFF

nvidia

Qwen3-Nemotron-32B-RLBFF是基于Qwen/Qwen3-32B微调的大语言模型，通过强化学习反馈技术显著提升了模型在默认思维模式下生成回复的质量。该模型在多个基准测试中表现出色，同时保持较低的推理成本。

Gpt Oss 120b Eagle3 V2

nvidia

NVIDIA GPT-OSS-120B Eagle3是基于OpenAI gpt-oss-120b模型的优化版本，采用混合专家（MoE）架构，具备1200亿总参数和50亿激活参数。该模型支持商业和非商业使用，适用于文本生成任务，特别适合AI Agent系统、聊天机器人等应用开发。

NVIDIA Nemotron Nano 9B V2 FP8 Dynamic

RedHatAI

这是NVIDIA-Nemotron-Nano-9B-v2模型的FP8动态量化版本，通过将权重和激活量化为FP8数据类型实现优化，显著减少磁盘大小和GPU内存需求约50%，同时保持出色的文本生成性能。

MCP

Nvidia Brev

Brev MCP服务器实现，使用Brev CLI的API访问令牌和当前组织配置，支持快速启动和开发调试。

python

6.2k

2.5分

Isaac Sim Mcp

Isaac Sim MCP扩展通过自然语言控制NVIDIA Isaac Sim，实现机器人模拟、场景创建和动态交互，连接MCP生态与具身智能应用。

python

9.6k

2.5分

Jetson Remote Monitor

一个基于FastMCP库的MCP服务器项目，用于通过网络客户端使用自然语言监控和远程控制Nvidia Jetson开发板。

python

9.2k

2.5分

Nvidia Usdcode Mcp Server

一个基于NVIDIA USDCode API的MCP服务器，提供Isaac Sim脚本编写、USD操作、Python代码片段和API使用帮助的AI助手工具。

typescript

2.5分

JetsonMCP

JetsonMCP是一个通过SSH连接管理NVIDIA Jetson Nano边缘计算设备的MCP服务器，提供AI工作负载优化、硬件配置和系统管理功能，支持自然语言指令转换为专业操作命令。

python

2.0分

Jetsonmcp

JetsonMCP是一个MCP服务器，通过SSH连接帮助AI助手管理和优化NVIDIA Jetson Nano边缘计算系统，提供AI工作负载部署、硬件优化和系统管理功能。

python

2.0分

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商务合作网站地图

AI资讯

估值飙升至 230 亿美元！Cerebras 携手 OpenAI 挑战 NVIDIA 算力霸权

​面壁智能首推“松果派”：AI原生端侧开发板开启硬件开发新范式

Nvidia 推出新一代 Rubin 芯片架构，全面提升 AI 计算能力

NVIDIA 发布 NitroGen：开创游戏代理的视觉行动基础模型

AI产品

GeForce RTX 5070 Ti

PDF to Podcast Blueprint by NVIDIA

GeForce RTX 5090

NVIDIA-Ingest

模型

Chronoedit

NVIDIA Nemotron Parse V1.1 TC

NVIDIA Nemotron Parse V1.1

NV Reason CXR 3B GGUF

Nvidia.Qwen3 Nemotron 32B GenRM Principle GGUF

Nvidia_Qwen3 Nemotron 32B RLBFF GGUF

ChronoEdit 14B GGUF

Qwen3 VL 2B Thinking GGUF

Thewhisper Large V3

NVIDIA Nemotron Nano 12B V2 VL NVFP4 QAD

NVIDIA Nemotron Nano 12B V2 VL FP8

Qwen3 Nemotron 8B BRRM

NVIDIA Nemotron Nano 12B V2 VL BF16

GR00T N1.5 3B LIBERO LONG

Llama Nemotron Rerank 1b V2

Llama Nemotron Embed 1b V2

Nemotron Flash 3B Instruct

Qwen3 Nemotron 32B RLBFF

Gpt Oss 120b Eagle3 V2

NVIDIA Nemotron Nano 9B V2 FP8 Dynamic

MCP

Nvidia Brev

Isaac Sim Mcp

Jetson Remote Monitor

Nvidia Usdcode Mcp Server

JetsonMCP

Jetsonmcp

面壁智能首推“松果派”：AI原生端侧开发板开启硬件开发新范式