Google DeepMindは、新世代のロボットAIモデル「Gemini Robotics On-Device」を正式にリリースしました。これは、ロボットAI技術がより効率的で自律性の高い段階へと進化する重要なマイルストーンとなります。このモデルはインターネット接続なしでもロボットのローカルで動作し、強力な汎用性とタスクへの適応能力を備えているため、産業用、倉庫、家庭サービスロボット分野において画期的な突破をもたらします。
クラウドの制限を打破、ロボットAIのローカル運用
Gemini Robotics On-Deviceは、Google Gemini2.0を基盤とした視覚・言語・動作(VLA)モデルであり、最大の特徴はロボットのローカルハードウェア上で完全に動作することです。これは、クラウド計算リソースに依存しないことを意味しています。これにより、従来のクラウドベースのロボットシステムではネットワーク状態が不安定な環境下で遅延や信頼性の問題が発生していた点を解決します。DeepMindの上級責任者Carolina Parada氏は、「このモデルは軽量で効率的であり、ロボットのハードウェア上で直接動作でき、低遅延およびオフライン環境での安定したパフォーマンスを確保できます」と述べています。
ローカルでの運用により、Gemini Robotics On-Deviceはネットワーク制限のある場面(工場、倉庫、または遠隔地など)におけるロボットの実用性を大幅に向上させました。テスト結果によると、その性能はクラウド版のGemini Roboticsモデルに近いものであり、多くのベンチマークテストで他のローカルAIモデルを上回る競争力を示しています。
汎用性と柔軟性:50回のデモから新しいタスクへの対応
Gemini Robotics On-Deviceは性能だけでなく、タスクへの適応能力にも注目されています。DeepMindは、このモデルがわずか50〜100回のデモで新しいタスクに迅速に対応できると発表しています。例えば、ジッパーを開く、服を畳む、あるいは工業部品の組み立てなどが可能です。
このモデルは最初にALOHAロボットで訓練されていましたが、現在はダブルアームのFranka FR3ロボットやApptronikのApollo人形ロボットにも成功裏に適合しており、複数のハードウェアプラットフォームでの汎用性を示しています。開発者は自然言語の指示を使ってモデルを制御したり微調整したりでき、複雑なダブルアームのタスクや動的な環境での新しいオブジェクトに対応することが可能になります。Parada氏は、「生成型AIによりロボットは少量のデータから一般化が可能となり、複雑なシナリオでの展開を大幅に加速させます」と強調しています。
オープンな開発者エコシステム、SDKによるイノベーション支援
Gemini Robotics On-Deviceの業界への応用を加速するために、Google DeepMindは同時にソフトウェア開発キット(SDK)をリリースしました。このSDKはGitHubを通じて「信頼されたテスター」プログラムの申請を開始しています。開発者はこのSDKを使用して、GoogleのMuJoCo物理シミュレーターまたは現実世界の環境でモデルをテストおよび微調整することができます。この取り組みは、DeepMindが初めてVLAモデルの微調整権限を開発者に開放したことを意味しており、ロボットAIのカスタマイズ可能な応用の道を切り開きます。
SDKは開発者がわずかなデモでロボットを特定のタスクに素早くトレーニングできるようにし、例えばキューブを袋に入れたり、精密な産業操作を行ったりすることが可能です。DeepMindは、このモデルが見慣れない新しいシナリオやオブジェクトにおいて優れた性能を発揮し、例えば産業用コンベアベルトで部品を組み立てるなど、強い汎化能力を示していると述べています。
安全と業界の将来:ロボットAIの次のステップ
安全性については、DeepMindはGemini Robotics On-Deviceが包括的な安全対策と専門家、政策立案者との協力により潜在的なリスクを最小限に抑えるよう努めていると強調しています。一方で、このモデルのリリースは、GoogleとNvidia GR00T、OpenAI RT-2などの競合企業が通用ロボットAI分野で激しい競争を繰り広げている一部として見られています。
倉庫ロボットから家庭用サービスロボットまで、Gemini Robotics On-Deviceのローカル運用能力と迅速な学習特性により、多様なシナリオでの広範な応用が可能になります。AIbaseは、この技術がロボットの導入コストを削減するとともに、AI駆動の自動化が日常生活のさまざまな場面に広がることを期待しています。
モデルの入口:https://deepmind.google/discover/blog/gemini-robotics-on-device-brings-ai-to-local-robotic-devices/