人工知能分野において、グーグルのDeepMindは今日、注目すべき新製品「Gemini Robotics On-Device」を発表しました。これはGeminiシリーズの新メンバーで、ロボット向けに設計されたものであり、継続的なインターネット接続に依存することなく、デバイス上でローカルに実行できます。このため、ロボットは新しいタスクや環境に速く適応でき、ネットワークがなくても安定したパフォーマンスを維持できます。

Gemini Robotics On-Deviceは、マルチモーダル推論能力を持つGemini2.0モデルを基盤としており、高い柔軟性とタスクの汎化能力を示しています。このモデルはさまざまなスマート操作に特化して最適化されており、例えば服をたたむことや袋のファスナーを開けるなどの繊細なタスクも、ロボット本体で実行可能です。

image.png

特に注目すべきは、Gemini Robotics On-Deviceが遅延に敏感なアプリケーションに最適であることで、ネットワーク接続が不安定な環境でも正常に動作します。開発者がこの新技術を最大限に活用できるようにするため、グーグルはGemini Robotics SDKをリリースする予定です。このSDKにより、開発者はモデルが特定のタスクにおける性能を評価しやすくなります。このSDKを使用することで、DeepMindのMuJoCo物理シミュレータでモデルをテストし、わずか50〜100のデモで新しい領域に迅速に適応させることができます。

性能面では、Gemini Robotics On-Deviceの複数のタスクへの適応能力は驚異的です。七つの異なる難易度の繊細な操作タスクにおいて、このモデルは優れたパフォーマンスを示しており、これまで見たことのないオブジェクトやシーンにも対応できます。これは、異なるロボットでの適応性だけでなく、汎用性も証明しています。

DeepMindのこの革新は、強力なロボットモデルの構築において新たな進展を示しており、真のエージェント型インテリジェンスの時代へと重要な一歩を踏み出しました。