阿里巴巴达摩院发布具身智能大脑基础模型RynnBrain,并向开发者开源7个全系列模型,包括30B MoE规模。该模型首次赋予机器人时空记忆与空间推理能力,显著提升智能交互水平,推动国产具身大脑基座模型开源生态发展。
优必选推出开源具身智能大模型Thinker,旨在提升工业人形机器人的空间理解和视觉感知能力,解决现有模型精度低、参数多、实时性差等问题。官方指出,当前机器人大模型面临数据质量参差不齐的挑战。
蚂蚁集团旗下蚂蚁灵波科技开源具身智能大模型LingBot-VLA及相关代码,验证了模型在不同机器人间的跨本体迁移能力,已适配星海图、松灵、乐聚等多家厂商。通过其开发的后训练工具链,在8卡GPU配置下可高效部署,推动智能机器人技术发展。
蚂蚁集团旗下灵波科技开源高精度空间感知模型LingBot-Depth,基于奥比中光双目3D相机数据,提升环境深度感知与三维空间理解能力,助力机器人、自动驾驶等智能终端实现更精准可靠的三维视觉,突破行业关键难题。
Alibaba
$0.7
Input tokens/M
$1.95
Output tokens/M
16
Context Length
Google
-
Openai
$7.7
$30.8
200
$2
128
$1
32
Anthropic
$1.75
$8.75
$5.6
$28
$1.05
$4.2
$3.5
$10.5
Tencent
$100
Tacoin
这是Tacoin基于NVIDIA GR00T模型在LIBERO libero long基准测试上进行微调的机器人操作模型。该模型采用双RGB流和8自由度状态输入,能够预测16步关节空间动作,专门用于长视野机器人操作任务。
Mungert
RoboBrain2.0-7B是专为机器人领域设计的强大模型,在多智能体任务规划、空间推理和闭环执行等方面有显著提升。
rogerxi
Spatial-LLaVA-7B是基于LLaVA模型微调的多模态模型,专注于提升空间关系推理能力,适用于多模态研究和聊天机器人开发。
homebrewltd
AlphaSpace是一种创新方法,旨在增强语言模型在三维笛卡尔空间中进行机器人操作的空间推理能力。
Menlo
AlphaSpace是一种增强语言模型在三维笛卡尔空间中进行机器人操作空间推理能力的创新方法。
IPEC-COMMUNITY
SpatialVLA是基于110万真实机器人操作片段训练的空间增强视觉语言动作模型,专注于机器人控制任务
COZE MCP Server是一个提供Coze资源和工具服务的模型上下文协议服务器,支持工作空间管理、机器人创建与交互等功能。