Nvidia stellt neue kleine offene Modellreihe Nemotron-Nano-9B-v2 mit intelligentem Schalter für die Schlussfolgerung vor

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 4 Minuten Lesezeit · Aug 19, 2025

Kürzlich hat Nvidia einen neuen kleinen Sprachmodell namens Nemotron-Nano-9B-v2 vorgestellt, der in verschiedenen Benchmarks gut abschneidet und dessen Inferenzfunktion flexibel ein- und ausgeschaltet werden kann. Der Modellparameterumfang beträgt 9 Milliarden, was eine erhebliche Reduzierung gegenüber den 12 Milliarden Parametern des Vorgängers darstellt und darauf abzielt, die Anforderungen eines einzelnen Nvidia A10-GPUs zu erfüllen.

Oleksii Kuchiaev, Leiter der Nachtrainingsentwicklung von Nvidias AI-Modellen, sagte, dass dieser Modell speziell für den A10GPU optimiert wurde und eine bis zu sechsmal höhere Verarbeitungsgeschwindigkeit ermöglicht, was ihn für verschiedene Anwendungsfälle geeignet macht. Nemotron-Nano-9B-v2 unterstützt mehrere Sprachen, einschließlich Englisch, Deutsch, Spanisch, Französisch, Italienisch, Japanisch sowie erweiterte Sprachen wie Koreanisch, Portugiesisch, Russisch und Chinesisch, und ist für Befehlsfolge und Codegenerierung geeignet.

Der Modell basiert auf der Nemotron-H-Serie und kombiniert Mamba- und Transformer-Architekturen, wodurch der Speicher- und Rechenaufwand bei der Verarbeitung langer Sequenzen reduziert wird. Im Gegensatz zu traditionellen Transformer-Modellen verwendet der Nemotron-H-Modell eine ausgewählte Zustandsraummodell (SSM), das die Genauigkeit gewährleistet und gleichzeitig effizientere Verarbeitung längerer Informationssequenzen ermöglicht.

Beim Inferenzprozess kann Nemotron-Nano-9B-v2 standardmäßig eine Nachverfolgung des Inferenzprozesses generieren. Benutzer können diese Funktion auch mit einfachen Steuerungsbefehlen wie /think oder /no_think aktivieren oder deaktivieren. Darüber hinaus wurde eine „Denkbudget“-Verwaltung zur Laufzeit eingeführt, die es Entwicklern ermöglicht, die maximale Anzahl der Token beim Inferenzprozess festzulegen, um ein Gleichgewicht zwischen Genauigkeit und Antwortgeschwindigkeit zu erreichen.

In Benchmark-Tests zeigte Nemotron-Nano-9B-v2 eine gute Genauigkeit. Zum Beispiel schnitt der Modell in verschiedenen Tests sehr gut ab, wenn er im „Inferenz aktiviert“-Modus mit dem NeMo-Skills-Kit verwendet wurde, was seine Vorteile gegenüber anderen kleineren Open-Source-Modellen zeigt.

Nvidia veröffentlichte Nemotron-Nano-9B-v2 unter einer offenen Modelllizenz, die kommerzielle Nutzung erlaubt und Entwicklern freie Erstellung und Verteilung abgeleiteter Modelle ermöglicht. Es ist erwähnenswert, dass Nvidia keine Ansprüche an die Ausgaben des Modells erhebt und die Nutzer vollständig Kontrolle über deren Nutzung haben.

Die Veröffentlichung dieses Modells zielt darauf ab, Entwicklern Werkzeuge zu bieten, um in kleineren Umgebungen die Inferenzfähigkeit und die Effizienz der Bereitstellung zu balancieren, und markiert Nvidias kontinuierliche Bemühungen, die Effizienz und die steuerbare Inferenzfähigkeit von Sprachmodellen zu verbessern.

huggingface:https://huggingface.co/nvidia/NVIDIA-Nemotron-Nano-9B-v2

Wichtige Punkte:
🌟 Nvidia hat ein neues kleines Sprachmodell namens Nemotron-Nano-9B-v2 vorgestellt, das es Benutzern ermöglicht, die Inferenzfunktion flexibel zu steuern.
⚙️ Dieses Modell basiert auf einer fortschrittlichen Hybridarchitektur und kann lange Sequenzen effizient verarbeiten, wodurch es für multilinguale Aufgaben geeignet ist.
📊 Nemotron-Nano-9B-v2 wurde unter einer offenen Modelllizenz veröffentlicht, die es Entwicklern ermöglicht, kommerzielle Nutzung und die Erstellung abgeleiteter Modelle vorzunehmen.

Indien wird 2026 gemeinsam mit Anthropic die globale KI-Konferenz veranstalten

Anthropic arbeitet mit der indischen Regierung zusammen und wird 2026 im Februar gemeinsam die globale KI-Konferenz veranstalten. Die Konferenz soll führende Experten, Wissenschaftler und Unternehmensführer zusammenbringen, um Trends in der Entwicklung und Anwendung von KI-Technologien zu teilen. Sie umfasst Bereiche wie maschinelles Lernen und natürliche Sprachverarbeitung und wird voraussichtlich viele internationale Teilnehmer anziehen.

Analysten: Die Größe der AI-Investitionsblase ist beeindruckend und 17-mal größer als die Internet-Blase

Die rasante Entwicklung der KI-Technologie löst Bedenken über eine Marktblase aus. Unabhängige Forschungsstellen zeigen, dass die KI-Blase beeindruckend groß ist und 17 Mal größer ist als die Internetblase Ende des letzten Jahrhunderts. Analysten betonen, dass die niedrigen Zinssätze die KI-Investitionswelle beflügelt haben.

Neuer Durchbruch in der intelligenten Landwirtschaft! China Agricultural University veröffentlicht den Shen Nong-Modell 3.0

China Agricultural University veröffentlicht das Shen Nong-Modell 3.0, das die landwirtschaftlichen Disziplinen und Anwendungsszenarien im ganzen Land abdeckt und die Landwirtschafts-KI in eine neue Phase führt. Das Modell konzentriert sich auf 36 landwirtschaftliche intelligente Agenten und erreicht das Ziel einer kleinen Größe, hoher Intelligenz und niedrigen Kosten. Es bietet drei Versionen mit 32B, 7B und 1B Parametern und verwendet dynamische Spärlichkeit sowie inkrementelle Komprimierungstechnik, wodurch die Rechenleistung um 50 % reduziert wird.

Google Lens und KI-Modus bieten Bildbearbeitungsfunktionen von Nano Banana

Google hat die Bildbearbeitungsfunktionen von Nano Banana veröffentlicht, die in die Gemini-App und Google Lens integriert sind und den KI-Modus unterstützen. Diese Funktion wurde am 13. Oktober eingeführt und ist derzeit für Android- und iOS-Nutzer in den USA und Indien verfügbar. Sie wird in Zukunft auf weitere Regionen ausgeweitet. Benutzer können mit einer bequemen Bedienung effiziente Bildverarbeitung und -erstellung durchführen.

Apple stellt das neue FS-DFM-Modell vor, die Effizienz beim Schreiben langer Texte wird um das 128-fache gesteigert!

Apple und die Ohio State University haben das FS-DFM-Modell gemeinsam vorgestellt. Mit nur 8 Iterationen kann es lange Texte erzeugen, die der Qualität von traditionellen Modellen mit tausenden Iterationen gleichkommen. Die Schreibgeschwindigkeit wird bis zu 128-mal erhöht und so die Effizienz beim Generieren langer Texte verbessert. Das Modell verwendet eine Technologie der diskreten Flussanpassung, wodurch es sich von selbstregressiven Modellen wie ChatGPT unterscheidet, die Zeichen für Zeichen generieren.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Nvidia stellt neue kleine offene Modellreihe Nemotron-Nano-9B-v2 mit intelligentem Schalter für die Schlussfolgerung vor

AIbase基地

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

TikTok und LV-NUS lancieren das SAIL-VL2-Modell: Kleine Größe, große Leistung!

Indien wird 2026 gemeinsam mit Anthropic die globale KI-Konferenz veranstalten

Analysten: Die Größe der AI-Investitionsblase ist beeindruckend und 17-mal größer als die Internet-Blase

Der Wert verdoppelt sich in sechs Monaten! Cursor schießt auf 27 Milliarden Dollar - KI-Programmierungstools werden zur neuen Lieblingssache der Investoren

Neuer Durchbruch in der intelligenten Landwirtschaft! China Agricultural University veröffentlicht den Shen Nong-Modell 3.0

HKU und Meituan lösen gemeinsam mathematische Herausforderungen im Bereich KI: CodePlot-CoT lehrt große Modelle, mit Code grafisch zu denken, Leistung steigt um 21%

Google Lens und KI-Modus bieten Bildbearbeitungsfunktionen von Nano Banana

Apple stellt das neue FS-DFM-Modell vor, die Effizienz beim Schreiben langer Texte wird um das 128-fache gesteigert!

China Agricultural University veröffentlicht den Shennong-Modell 3.0, KI unterstützt die ländliche Erneuerung

Google NotebookLM bietet Anime-Video-Funktion: Nano Banana generiert sechs Kunststilarten mit einem Klick, die chinesische Unterstützung muss noch optimiert werden

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Nvidia stellt neue kleine offene Modellreihe Nemotron-Nano-9B-v2 mit intelligentem Schalter für die Schlussfolgerung vor

AIbase基地

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

TikTok und LV-NUS lancieren das SAIL-VL2-Modell: Kleine Größe, große Leistung!

​Indien wird 2026 gemeinsam mit Anthropic die globale KI-Konferenz veranstalten

Analysten: Die Größe der AI-Investitionsblase ist beeindruckend und 17-mal größer als die Internet-Blase

Der Wert verdoppelt sich in sechs Monaten! Cursor schießt auf 27 Milliarden Dollar - KI-Programmierungstools werden zur neuen Lieblingssache der Investoren

Neuer Durchbruch in der intelligenten Landwirtschaft! China Agricultural University veröffentlicht den Shen Nong-Modell 3.0

HKU und Meituan lösen gemeinsam mathematische Herausforderungen im Bereich KI: CodePlot-CoT lehrt große Modelle, mit Code grafisch zu denken, Leistung steigt um 21%

Google Lens und KI-Modus bieten Bildbearbeitungsfunktionen von Nano Banana

​Apple stellt das neue FS-DFM-Modell vor, die Effizienz beim Schreiben langer Texte wird um das 128-fache gesteigert!

China Agricultural University veröffentlicht den Shennong-Modell 3.0, KI unterstützt die ländliche Erneuerung

Google NotebookLM bietet Anime-Video-Funktion: Nano Banana generiert sechs Kunststilarten mit einem Klick, die chinesische Unterstützung muss noch optimiert werden

GEO Services

Indien wird 2026 gemeinsam mit Anthropic die globale KI-Konferenz veranstalten

Apple stellt das neue FS-DFM-Modell vor, die Effizienz beim Schreiben langer Texte wird um das 128-fache gesteigert!