Bei der kürzlich stattgefundenen internationalen Konferenz SIGGRAPH für Computergrafik und interaktive Technologien zeigte NVIDIA eine Reihe neuer Technologien für Roboterentwickler, wobei das besonders auffällige Open-Source-Physik-KI-Modell Cosmos Reason hervorragend war. Dieses Modell verfügt über 7 Milliarden Parameter und soll Roboter eine effizientere visuelle Schlussfolgerung ermöglichen.
NVIDIA betonte, dass seit der Einführung des CLIP-Modells durch OpenAI in der Computer Vision erhebliche Fortschritte gemacht wurden, insbesondere bei Aufgaben wie Objekterkennung und Mustererkennung. Traditionelle Modelle haben jedoch oft Schwierigkeiten mit komplexen mehrschrittigen Aufgaben, insbesondere bei unscharfen oder neuen realen Szenarien. Durch seine ausgezeichnete Gedächtnis- und Verständnisfähigkeit ermöglicht Cosmos Reason es Robotern, wie Menschen zu denken und somit rationale Handlungsentscheidungen im echten Leben zu treffen.
Im praktischen Anwendungsbeispiel, das NVIDIA präsentierte, erkannte die Roboterhand, die das visuelle Schlussfolgerungsmodell ausführte, die Kombination „Brot + Toaster“ und leitete logisch den nächsten Schritt ab, nämlich das Brot in den Toaster zu geben, um es zu backen. Dieser Prozess wird als „Roboterplanung und -reasoning“ bezeichnet und zeigt die Effizienz und Flexibilität von Cosmos Reason bei der Bearbeitung komplexer Anweisungen.
Außerdem kann Cosmos Reason weitreichend in anderen Bereichen der KI eingesetzt werden. Zum Beispiel kann es große, vielfältige Trainingsdatensätze automatisiert verarbeiten, ordnen und kennzeichnen. Darüber hinaus kann es wichtige Informationen aus umfangreichen Videodaten extrahieren und effektiv analysieren. Derzeit ist das Modell bereits kommerziell in Betrieb, und Teams innerhalb von NVIDIA, die sich mit Robotik und autonomen Fahrzeugen beschäftigen, verwenden es zur Datenverarbeitung und Kennzeichnung.
Es ist erwähnenswert, dass Uber auch Cosmos Reason nutzt, um die Trainingsdaten für sein autonomes Fahren zu kennzeichnen und Anweisungen zu generieren. Magna International entwickelt mit diesem Modell Lösungen für vollautomatische Lieferdienste, die darauf abzielen, Fahrzeuge schneller an neue städtische Umgebungen anzupassen. Darüber hinaus setzen Unternehmen wie VAST Data und Milestone Systems diese Technologie auch in Bereichen wie Verkehrsüberwachung und visueller Erkennung ein.
Abgesehen von Cosmos Reason fügte NVIDIA auch Cosmos Transfer-2 in das Cosmos-Weltmodell hinzu, um die Generierung synthetischer Daten in 3D-Simulationsumgebungen zu beschleunigen. Gleichzeitig aktualisierte NVIDIA das Omniverse Software Development Kit und stellte eine neue Neurale Rekonstruktionsbibliothek vor, was die Auswahl der Entwickler weiter erweitert.
Wichtige Punkte:
1. 🤖 Das von NVIDIA vorgestellte Cosmos Reason-Modell ermöglicht Robotern eine effiziente visuelle Schlussfolgerung und komplexe Entscheidungen.
2. 🚗 Das Modell wird bereits in verschiedenen kommerziellen Bereichen eingesetzt, darunter die Datenkennzeichnung für autonome Fahrzeuge von Uber und die Lieferlösungen von Magna International.
3. 🛠️ NVIDIA hat zudem Entwicklungstools aktualisiert und fördert damit die Integration von Robotiktechnologie und KI.