3D视觉大模型SpatialLM开源,实时识别场景内容
在人工智能领域,3D视觉与空间理解技术正成为推动具身智能、自主导航及虚拟现实等应用的关键。2025年3月,杭州群核科技在GTC2025全球大会上宣布正式开源其自主研发的3D视觉大语言模型 SpatialLM,引发业界广泛关注。这一模型以其强大的空间认知能力和低成本的数据处理方式,为机器人训练、建筑设计及AR/VR等领域带来了革命性突破。AIbase基于最新信息,整理并深入解析SpatialLM的技术亮点与行业影响。SpatialLM:从手机视频到物理正确的3D场景SpatialLM是一款专为三维空间理解设计的大语言模型