Nvidia stellt kleines offenes Modell Nemotron-Nano-9B-v2 vor: Wechselbare Inferenzfunktionen

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 5 Minuten Lesezeit · Sep 1, 2025

Kürzlich hat Nvidia offiziell ein neues kleines Sprachmodell namens Nemotron-Nano-9B-v2 veröffentlicht, was die Welle der kleinen Modelle erneut befeuert.

Dieses Modell verfügt über 9 Milliarden Parameter. Obwohl es größer ist als andere kleine Modelle mit Millionen von Parametern, ist es im Vergleich zu den ursprünglichen 12 Milliarden Parametern deutlich reduziert und soll effizient auf einer einzigen Nvidia A10-GPU laufen. Oleksii Kuchiaev, Leiter der Nachtrainierung von AI-Modellen bei Nvidia, betonte auf sozialen Plattformen, dass das Ziel darin besteht, besser auf Deployment-Anforderungen abgestimmt zu sein. Darüber hinaus verwendet das Modell eine gemischte Architektur, wodurch es bei der Verarbeitung größerer Batch-Größen sechs Mal schneller ist als vergleichbare Transformer-Modelle.

Nemotron-Nano-9B-v2 unterstützt verschiedene Sprachen wie Englisch, Deutsch, Spanisch, Französisch, Italienisch, Japanisch usw. und eignet sich für Aufgaben wie Anweisungsfolge und Code-Generierung. Das Modell beinhaltet auch eine innovative Funktion: Benutzer können durch einfache Steuerungstoken den „Reasoning“-Prozess des AI wechseln, also eine Selbstprüfung vor dem Generieren einer Antwort. Das System generiert standardmäßig einen Reasoning-Verlauf, doch Benutzer können diesen Prozess über Befehle wie /think oder /no_think kontrollieren. Darüber hinaus wurde ein „Reasoning-Budget“-Management-Mechanismus eingeführt, der Entwicklern ermöglicht, die Anzahl der verwendeten Tokens während des Reasoning-Prozesses festzulegen, um ein Gleichgewicht zwischen Genauigkeit und Reaktionsgeschwindigkeit zu erreichen.

Laut Testergebnissen zeigt Nemotron-Nano-9B-v2 hervorragende Leistungen in verschiedenen Benchmark-Tests. Unter dem „Reasoning-Modus“ erzielte das Modell zufriedenstellende Ergebnisse in Tests wie AIME25, MATH500, GPQA und LiveCodeBench. Darüber hinaus zeigte es ebenfalls gute Leistungen bei Anweisungsfolge- und Lang-Kontext-Benchmark-Tests und demonstrierte eine höhere Genauigkeit im Vergleich zu anderen offenen kleinen Modellen.

Nvidia hat eine Open-Source-Lizenz für dieses Modell festgelegt, die Entwicklern erlaubt, das Modell kommerziell frei zu nutzen und weiterzuverbreiten, und klargestellt, dass sie keine Ansprüche an die erzeugten Ausgaben erheben. Dies bedeutet, dass Unternehmen das Modell ohne zusätzliche Verhandlungen direkt in die Produktion einsetzen können, ohne sich um Nutzungshürden oder Kosten sorgen zu müssen.

Das Modell Nemotron-Nano-9B-v2 von Nvidia bietet Entwicklern neue Werkzeuge, um bei kleineren Skalen Inferenzfähigkeit und effiziente Bereitstellung zu realisieren. Seine Funktionalitäten zur Kontrolle des Betriebsbudgets und zum Wechsel des Inferenzmodus bieten Systementwicklern Flexibilität und sollen die Genauigkeit und Reaktionsgeschwindigkeit verbessern, um die Entwicklung kleiner Sprachmodelle weiter voranzutreiben.

Zusammenfassung:
🌟 Nemotron-Nano-9B-v2 ist ein neues kleines Sprachmodell von Nvidia mit 9 Milliarden Parametern, speziell für eine effiziente Bereitstellung konzipiert.
🧠 Das Modell unterstützt mehrere Sprachen und verfügt über eine Funktion zum Wechsel des Inferenzmodus, die Benutzern hilft, die Antwortweise entsprechend ihren Bedürfnissen anzupassen.
📈 Die offene Lizenzvereinbarung ermöglicht Entwicklern, das Modell frei zu nutzen und weiterzuverbreiten, ohne sich um zusätzliche Kosten oder Lizenzvereinbarungen kümmern zu müssen.

AI-Tageszeitung: Douyin veröffentlicht ein vollautomatisches System für Mehrpersonen-Sprechersysteme; Adobe Firefly Image 5 erhebliche Verbesserungen; Soul- Sprachmodell SoulX-Podcast wird vorgestellt

Das Sprachteam von Douyin stellt eine vollautomatische AI-Mehrpersonen-Hörspiel-Produktionsmethode vor, die Romane automatisch in Mehrpersonen-Sprecherspiele umwandeln kann. Die Genauigkeit der Rollenerkennung erreicht 98 % und ist mit dem Niveau professioneller Hörspiele vergleichbar, wodurch die Effizienz der Produktion von AI-Hörinhalten erheblich gesteigert wird.

Qualcomm dringt in den Datenbank-Markt ein! Einführung der AI200/AI250-Chips mit Ziel Nvidia, Aktienkurs steigt um 20% an einem Tag

Qualcomm hat zwei Cloud-AI-Inferring-Chips, AI200 und AI250, vorgestellt und plant deren kommerzielle Nutzung im Jahr 2026 bzw. 2027. Dies markiert den Übergang von Endgeräte-Chips zu einer vollständigen AI-Infrastruktur. Die Nachricht führte zu einem Anstieg des Aktienkurses um mehr als 20% an einem Tag und ist der größte Anstieg seit 2019. Im Gegensatz zur allseitigen Strategie von Nvidia konzentriert sich Qualcomm auf den Markt für große Modell-Inferring und betont die Vorteile der Energieeffizienz und Kosten.

NVIDIA präsentiert eine revolutionäre AI-Rechenzentrum-Design, um leistungsstarke Berechnungen zu unterstützen

Bei der GTC-Messe 2025 stellte NVIDIA das Designkonzept 'Omniverse DSX Blueprint' für gigawattgroße AI-Rechenzentren vor und bezeichnete es als 'AI-Fabrik'. Dieses Konzept basiert auf dem Omniverse-Framework und unterstützt verschiedene Größen von 100 Millionen bis 1 Milliarde Watt. Es soll die effiziente Ausbildung und Ausführung großer KI-Modelle ermöglichen und den wachsenden Anforderungen an KI-Berechnungen gerecht werden. Es handelt sich um einen wichtigen Fortschritt in der Infrastruktur für künstliche Intelligenz.

Die AI-Audio-Serie-Revolution bricht aus! Doubao präsentiert ein automatisches Mehrpersonen-Stimmen-System mit einer Erkennungspräzision von 98 %, die professionellen Hörspielen in nichts nachsteht

Das Doubao-Stimme-Team hat eine "automatisierte Produktion für AI-Mehrpersonen-Audio-Serien" vorgestellt, die die gesamte Produktionskette vom Roman-Text bis zum fertigen Hörspiel vollständig automatisiert. Keine Stimmenaufnahme, Schnitt oder menschliche Intervention erforderlich, was zu erheblichen Kosteneinsparungen und Effizienzsteigerungen führt. Das Ergebnis ist nahe an professionelles Niveau, wobei die Präzision der Rollenerkennung 98 % erreicht.

Ehemaliger Leiter der AI-Produkte bei ByteDance Jiansheng Liu gründet Unternehmen und stellt einen Marketing-Multimodal-Agent vor

Ehemaliger Leiter der AI-Produkte bei ByteDance, Liu Liaoqian, gründete das Unternehmen 'Extremes Kontext' und konzentriert sich auf die Entwicklung eines Marketing-Multimodal-Agents. Dank seiner reichen Erfahrung im Bereich AIGC schloss er schnell eine Finanzierungsrunde von mehreren Millionen Dollar ab. Liu Liaoqian arbeitete zuvor bei Tencent und ByteDance und beschäftigte sich seit 2019 mit AIGC-Technologien, was Aufmerksamkeit in der Branche erregte.

360 veröffentlicht den weltweit ersten L2-L4-Stack-Intelligenzplattform! Die AI-Umstellung für Regierung und Unternehmen erreicht eine Ära des „Out-of-the-box“-Betriebs

Die 360 Gruppe veröffentlichte eine unternehmensrelevante Intelligenzplattform und stellte das weltweit erste Intelligenz-Betriebssystem vor, das L2 bis L4 abdeckt. Zudem wurde die SEAF-Intelligenzfabrik aktualisiert. Die Plattform zielt darauf ab, Regierungen und Unternehmen mit einer einheitlichen AI-Lösung zu versorgen und die Implementierung der Industrieanpassung von "0 auf 1" zu "1 auf 10" zu fördern.

Huang Renxun widerspricht der Theorie des AI-Blasen, NVIDIA's neue Chips werden voraussichtlich 500 Milliarden Dollar Umsatz erzielen

Der CEO von NVIDIA, Huang Renxun, lehnte die Theorie des AI-Markt-Blasen auf der GTC-Konferenz in Washington ab und erwartet, dass die neuen Blackwell- und Rubin-Chips in den nächsten Quartalen 500 Milliarden Dollar Umsatz erzeugen werden und damit eine neue Wachstumsphase für das Unternehmen einleiten. Dies ist die erste GTC-Konferenz, die NVIDIA in der US-Hauptstadt veranstaltet.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

GEO Brand Visibility

AI Visibility Audit

AI Search Visibility Checker

AI Conversation Insight

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Ranking Optimization

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

LLM API Hub

AI Models Finder

Model Providers

LLM Leaderboard

Compare LLMs

LLM Cost Calculator

LLM Arena

AI Model Compatibility Checker

AI Deployment Calculator

Nvidia stellt kleines offenes Modell Nemotron-Nano-9B-v2 vor: Wechselbare Inferenzfunktionen

AIbase基地

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

HYPERCLOUD stellt das erste interaktive AI-Podcast in China vor, bei dem Benutzer jederzeit Fragen stellen können

AI-Tageszeitung: Douyin veröffentlicht ein vollautomatisches System für Mehrpersonen-Sprechersysteme; Adobe Firefly Image 5 erhebliche Verbesserungen; Soul- Sprachmodell SoulX-Podcast wird vorgestellt

Qualcomm dringt in den Datenbank-Markt ein! Einführung der AI200/AI250-Chips mit Ziel Nvidia, Aktienkurs steigt um 20% an einem Tag

NVIDIA präsentiert eine revolutionäre AI-Rechenzentrum-Design, um leistungsstarke Berechnungen zu unterstützen

Die AI-Audio-Serie-Revolution bricht aus! Doubao präsentiert ein automatisches Mehrpersonen-Stimmen-System mit einer Erkennungspräzision von 98 %, die professionellen Hörspielen in nichts nachsteht

Ehemaliger Leiter der AI-Produkte bei ByteDance Jiansheng Liu gründet Unternehmen und stellt einen Marketing-Multimodal-Agent vor

SoulX-Podcast-Modell der Soul-Sprachtechnologie: Schockierende Veröffentlichung des 90-minütigen ununterbrochenen Podcasts - AI-Sprachrevolution wird erneut verbessert

Google stellt AI-Marketing-Tool Pomelli vor: Automatisches Erstellen von Markeninhalten mit nur einer Webadresse

360 veröffentlicht den weltweit ersten L2-L4-Stack-Intelligenzplattform! Die AI-Umstellung für Regierung und Unternehmen erreicht eine Ära des „Out-of-the-box“-Betriebs

Huang Renxun widerspricht der Theorie des AI-Blasen, NVIDIA's neue Chips werden voraussichtlich 500 Milliarden Dollar Umsatz erzielen

Empfohlene verwandte KI-Nachrichten

HYPERCLOUD stellt das erste interaktive AI-Podcast in China vor, bei dem Benutzer jederzeit Fragen stellen können

AI-Tageszeitung: Douyin veröffentlicht ein vollautomatisches System für Mehrpersonen-Sprechersysteme; Adobe Firefly Image 5 erhebliche Verbesserungen; Soul- Sprachmodell SoulX-Podcast wird vorgestellt

Qualcomm dringt in den Datenbank-Markt ein! Einführung der AI200/AI250-Chips mit Ziel Nvidia, Aktienkurs steigt um 20% an einem Tag

NVIDIA präsentiert eine revolutionäre AI-Rechenzentrum-Design, um leistungsstarke Berechnungen zu unterstützen

Die AI-Audio-Serie-Revolution bricht aus! Doubao präsentiert ein automatisches Mehrpersonen-Stimmen-System mit einer Erkennungspräzision von 98 %, die professionellen Hörspielen in nichts nachsteht

Ehemaliger Leiter der AI-Produkte bei ByteDance Jiansheng Liu gründet Unternehmen und stellt einen Marketing-Multimodal-Agent vor

SoulX-Podcast-Modell der Soul-Sprachtechnologie: Schockierende Veröffentlichung des 90-minütigen ununterbrochenen Podcasts - AI-Sprachrevolution wird erneut verbessert

Google stellt AI-Marketing-Tool Pomelli vor: Automatisches Erstellen von Markeninhalten mit nur einer Webadresse

360 veröffentlicht den weltweit ersten L2-L4-Stack-Intelligenzplattform! Die AI-Umstellung für Regierung und Unternehmen erreicht eine Ära des „Out-of-the-box“-Betriebs

Huang Renxun widerspricht der Theorie des AI-Blasen, NVIDIA's neue Chips werden voraussichtlich 500 Milliarden Dollar Umsatz erzielen