最好的Nemotron AI工具模型_精選Nemotron資訊 - AIBase

AI資訊

NVIDIA 發佈 Nemotron 3 Embed 系列，8B 版本登頂 RTEB 檢索基準

NVIDIA推出Nemotron3Embed嵌入向量模型系列，專爲生產級RAG、智能體檢索、代碼檢索和記憶場景設計。8B版本在RTEB基準測試中排名第一，成爲性能最強的開源嵌入模型。系列包含三個開放檢查點：精度優先的Nemotron-3-Embed-8B-BF16、輕量化的1B-BF16版，以及針對Blackwell架構優化的1B-NVFP4四比特版本，所有模型均採用雙向注意力機制。

239.5k 5 小時前

NVIDIA 發佈 Nemotron 3 Embed 系列，8B 版本登頂 RTEB 檢索基準

英偉達推出統一音頻智能模型 Nemotron-Labs-Audex-30B-A3B

NVIDIA推出統一音頻-文本大模型Audex，基於純文本MoE架構，採用單一Transformer，解決多模態模型音頻增強導致文本邏輯下降的難題，實現高效音頻理解與文本能力的平衡。

15.7k 8 小時前

英偉達推出統一音頻智能模型 Nemotron-Labs-Audex-30B-A3B

英偉達雙塔 AI 模型開源發佈，文本生成速度提升 2.42 倍、畫質保留 98.7%

英偉達發佈Nemotron-Labs-TwoTower離散擴散語言模型，解決大模型逐token生成速度慢的痛點，權重已在Huggingface開源。該模型複用現有骨幹網預訓練權重，無需從頭訓練，顯著降低成本。採用60B雙塔架構，兩座30B網絡並行協同，每塔激活3B參數並搭載128個可路由專家模塊，提升生成效率。

17.7k 22 小時前

英偉達雙塔 AI 模型開源發佈，文本生成速度提升 2.42 倍、畫質保留 98.7%

性能提升超兩倍：英偉達發佈 Nemotron-Labs-TwoTower 擴散語言模型

英偉達開源Nemotron-Labs-TwinTower擴散語言模型，通過“雙塔”架構突破自迴歸模型的串行解碼瓶頸。該模型將生成任務拆分爲兩個子網絡，其中一個保持凍結，以並行方式提升文本生成吞吐量，爲大規模合成任務提供高效新解法。

19k 18 小時前

性能提升超兩倍：英偉達發佈 Nemotron-Labs-TwoTower 擴散語言模型

AI產品

Llama 3.1 Nemotron Ultra 253B

Llama 3.1 Nemotron Ultra 253B

一款高效的推理與聊天大語言模型。

Nemotron-CC

Nemotron-CC

將Common Crawl轉化為精細的長期預訓練數據集

Llama-3.1-Nemotron-70B-Instruct

Llama-3.1-Nemotron-70B-Instruct

由NVIDIA定製的大型語言模型，提升查詢回答的幫助性。

Llama-3.1-Nemotron-51B

Llama-3.1-Nemotron-51B

高效準確的AI語言模型

模型

NVIDIA Nemotron Parse V1.1 TC

nvidia

NVIDIA Nemotron Parse v1.1 TC 是一款先進的文檔語義理解模型，能夠從圖像中提取具有空間定位的文本和表格元素，生成結構化註釋，包括格式化文本、邊界框和語義類別。相比前一版本，速度提升20%，並保留無序元素的頁面順序。

Transformers

NVIDIA Nemotron Parse V1.1

nvidia

NVIDIA Nemotron Parse v1.1 是一款先進的文檔解析模型，專門用於理解文檔語義並提取具有空間定位的文本和表格元素。它能夠將非結構化文檔轉換為機器可讀的結構化表示，克服了傳統OCR在處理複雜文檔佈局時的侷限性。

Transformers

NVIDIA Nemotron Nano 12B V2 VL BF16

nvidia

NVIDIA Nemotron Nano v2 12B VL是一款強大的多模態視覺語言模型，支持多圖像推理和視頻理解，具備文檔智能、視覺問答和摘要功能，可用於商業用途。

Transformers

Llama Nemotron Rerank 1b V2

nvidia

Llama Nemotron Reranking 1B是NVIDIA開發的專門用於文本檢索重排序的模型，基於Llama-3.2-1B架構微調，能夠為查詢-文檔對提供相關性對數得分，支持多語言和長文檔處理。

自然語言處理

Transformers

Transformers其他

Llama Nemotron Embed 1b V2

nvidia

Llama Nemotron Embedding 1B模型是NVIDIA開發的專為多語言和跨語言文本問答檢索優化的嵌入模型，支持26種語言，能夠處理長達8192個標記的文檔，並可通過動態嵌入大小大幅減少數據存儲佔用。

自然語言處理

Transformers

Transformers其他

Nemotron Flash 3B Instruct

nvidia

Nemotron-Flash-3B 是英偉達推出的新型混合小型語言模型，專門針對實際應用中的低延遲需求設計。該模型在數學、編碼和常識推理等任務中展現出卓越性能，同時具備出色的小批量低延遲和大批量高吞吐量特性。

自然語言處理

Transformers

Llama 3_3 Nemotron Super 49B V1_5 Mlx 4Bit

mlx-community

這是一個基於NVIDIA Nemotron架構的49B參數大語言模型，已轉換為MLX格式並進行了4位量化，專門為Apple Silicon芯片優化，提供高效的文本生成能力。

自然語言處理

Transformers

Transformers英語

NVIDIA Nemotron Nano 9B V2

unsloth

NVIDIA Nemotron Nano 9B v2 是 NVIDIA 開發的一款高性能大語言模型，採用 Mamba2-Transformer 混合架構，支持多語言推理和聊天任務，在多個基準測試中表現優異，特別支持運行時'思考'預算控制功能。

自然語言處理

Transformers

Transformers多語言

NVIDIA Nemotron Nano 12B V2 GGUF

Mungert

NVIDIA Nemotron Nano 12B v2是由NVIDIA開發的大語言模型，採用Mamba2-Transformer混合架構，具有120億參數。該模型支持多語言處理，在多個基準測試中表現出色，特別擅長推理任務，支持運行時推理預算控制。

自然語言處理

Transformers

Transformers多語言

NVIDIA Nemotron Nano 12B V2 AWQ 4bit

cpatonn

NVIDIA Nemotron Nano 12B v2是由NVIDIA從頭訓練的大型語言模型，專為推理和非推理任務設計。採用混合Mamba2-Transformer架構，支持多語言，具備可控推理能力，可根據用戶需求生成推理過程或直接給出答案。

自然語言處理

Transformers

Transformers多語言

NVIDIA Nemotron Nano 12B V2 GGUF

QuantFactory

這是 NVIDIA Nemotron Nano 12B v2 模型的 GGUF 量化版本，採用混合 Mamba-2 和 Transformer 架構，支持多語言推理和聊天功能，具有 120 億參數，支持長達 128K 的上下文長度。

自然語言處理

Transformers

Transformers多語言

Nvidia_NVIDIA Nemotron Nano 12B V2 GGUF

bartowski

這是NVIDIA Nemotron-Nano-12B-v2模型的Llamacpp imatrix量化版本，提供多種量化選項，從BF16到極低比特率的IQ2量化，幫助用戶在不同硬件條件下高效運行該模型。

自然語言處理

Gguf

Nvidia_Nemotron H 47B Reasoning 128K GGUF

bartowski

這是NVIDIA Nemotron-H-47B-Reasoning-128K模型的量化版本，使用llama.cpp的imatrix技術進行優化。該模型支持128K上下文長度，專為推理任務設計，提供了從BF16到極低比特率的多種量化選項，適合不同硬件配置和性能需求。

自然語言處理

Gguf

Nvidia_Nemotron H 8B Reasoning 128K GGUF

bartowski

這是NVIDIA Nemotron-H-8B-Reasoning-128K模型的Llamacpp imatrix量化版本，提供多種量化類型的模型文件，以滿足不同硬件和性能需求。支持128K上下文長度，專為推理任務優化。

自然語言處理

Gguf

Nvidia_NVIDIA Nemotron Nano 9B V2 GGUF

bartowski

這是NVIDIA Nemotron-Nano-9B-v2模型的量化版本，使用llama.cpp b6317版本進行量化處理。該模型提供了多種量化選項，包括bf16、Q8_0、Q6_K_L等，適用於不同的硬件和使用場景，方便用戶部署和使用。

自然語言處理

Gguf

NVIDIA Nemotron Nano 9B V2 4bits

mlx-community

這是NVIDIA Nemotron Nano 9B v2模型的4位量化版本，專為Apple Silicon優化，使用MLX框架轉換。該模型是一個9B參數的大型語言模型，支持多語言文本生成任務。

自然語言處理

Mlx

NVIDIA Nemotron Nano 12B V2

nvidia

NVIDIA Nemotron Nano 12B v2 是由 NVIDIA 從零開始訓練的大語言模型，專為推理和非推理任務設計。該模型採用混合架構，結合 Mamba-2 和注意力層，支持多語言處理，並可通過系統提示控制推理能力。

自然語言處理

Transformers

Transformers多語言

Nvidia_OpenReasoning Nemotron 32B GGUF

bartowski

NVIDIA OpenReasoning - Nemotron - 32B的量化版本，通過llama.cpp進行量化處理，減少模型存儲和計算資源需求，便於部署。

自然語言處理

Gguf

OpenReasoning Nemotron 14B GGUF

lmstudio-community

這是英偉達OpenReasoning Nemotron 14B的量化版本，由bartowski基於llama.cpp提供GGUF量化。

自然語言處理

Gguf

lmstudio-community

OpenReasoning Nemotron 7B GGUF

lmstudio-community

這是英偉達OpenReasoning Nemotron 7B模型的GGUF量化版本，專門用於文本生成任務。該模型通過LM Studio社區模型亮點計劃提供，支持高效的推理和部署。

自然語言處理

Gguf

lmstudio-community

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

© 2026AIBase

商務合作網站地圖