原力霊機チームは、従来の視覚-言語-行動モデルが複雑な環境で2D画像に依存しているため、空間認識が不足している問題に対処するために、新しい方法を提案しました。この方法は、ロボットが3次元空間の深度と位置をより正確に判断できるようにすることを目的としています。