Im Bereich der Künstlichen Intelligenz hat Google DeepMind heute ein aufregendes neues Produkt namens Gemini Robotics On-Device vorgestellt. Dies ist ein neues Mitglied der Gemini-Familie, das speziell für Roboter entwickelt wurde und direkt auf dem Gerät lokal läuft, ohne eine kontinuierliche Internetverbindung zu benötigen. Das bedeutet, dass Roboter nicht nur schneller neue Aufgaben und Umgebungen anpassen können, sondern auch bei fehlender Netzwerkverbindung stabil funktionieren.
Gemini Robotics On-Device basiert auf dem multimodalen Inferenzvermögen des Gemini2.0-Modells und zeigt starke Flexibilität und Fähigkeit zur Aufgabengeneralisierung. Es wurde sorgfältig optimiert und für verschiedene intelligente Operationen entworfen, wie das Falten von Kleidung oder das Öffnen von Reißverschlüssen, wobei alle Operationen direkt auf dem Roboter durchgeführt werden können.
Es ist besonders erwähnenswert, dass Gemini Robotics On-Device für Anwendungen geeignet ist, die empfindlich gegenüber Verzögerungen sind und sicherstellen kann, dass sie auch in Umgebungen mit schlechtem Netzwerkzugang ordnungsgemäß funktionieren. Um Entwicklern dabei zu helfen, diese neue Technologie optimal zu nutzen, wird Google auch das Gemini Robotics SDK veröffentlichen, um Entwicklern die Bewertung der Modellleistung bei bestimmten Aufgaben zu erleichtern. Mit diesem SDK können Entwickler das Modell in der MuJoCo-Physik-Simulationsumgebung von DeepMind testen und es schnell auf neue Bereiche anpassen, wobei nur 50 bis 100 Demonstrationen erforderlich sind.
In Bezug auf die Leistung ist die Anpassungsfähigkeit von Gemini Robotics On-Device bei mehreren Aufgaben beeindruckend. Das Modell schneidet in sieben verschiedenen schwierigen Handlungsaufgaben gut ab und kann Objekte und Szenen verarbeiten, die es zuvor noch nicht gesehen hat. Dies zeigt nicht nur seine Anpassungsfähigkeit an verschiedene Roboter, sondern bestätigt auch seine Allgemeingültigkeit.
Der Fortschritt von DeepMind markiert einen neuen Schritt im Bau leistungsstarker Robotikmodelle und ist ein wichtiger Schritt Richtung echter embodied Intelligence.