3D視覺大模型SpatialLM開源,實時識別場景內容
在人工智能領域,3D視覺與空間理解技術正成爲推動具身智能、自主導航及虛擬現實等應用的關鍵。2025年3月,杭州羣核科技在GTC2025全球大會上宣佈正式開源其自主研發的3D視覺大語言模型 SpatialLM,引發業界廣泛關注。這一模型以其強大的空間認知能力和低成本的數據處理方式,爲機器人訓練、建築設計及AR/VR等領域帶來了革命性突破。AIbase基於最新信息,整理並深入解析SpatialLM的技術亮點與行業影響。SpatialLM:從手機視頻到物理正確的3D場景SpatialLM是一款專爲三維空間理解設計的大語言模型