3Dビジョン大規模言語モデルSpatialLMがオープンソース化 リアルタイムでのシーン内容認識を実現
人工知能の分野において、3Dビジョンと空間理解技術は、エンボディッドAI、自律ナビゲーション、仮想現実などのアプリケーションを推進する鍵となっています。2025年3月、杭州群核科技はGTC2025グローバルカンファレンスで、自主開発した3Dビジョン大規模言語モデルSpatialLMの正式オープンソース化を発表し、業界の注目を集めました。このモデルは、その強力な空間認識能力と低コストのデータ処理方法により、ロボットトレーニング、建築設計、AR/VRなどの分野に革命的なブレークスルーをもたらします。AIbaseは最新の情報を元に...