谷歌DeepMind聘请波士顿动力前CTO亚伦·桑德斯担任硬件工程副总裁,强化机器人领域布局。桑德斯以开发后空翻、跳舞机器人闻名,其加入是CEO哈萨比斯推进“Gemini”计划的关键一步。哈萨比斯称,该计划旨在打造类似安卓系统的机器人操作系统。
瑞士迪士尼研究团队开发新系统,解决双足机器人跌倒时易损坏敏感组件的问题。现有技术保护不足,新方案旨在实现安全优雅的着陆,提升机器人应对意外推搡或障碍的能力。
南韩初创企业Bone AI于2024年初成立,专注AI与制造技术融合,开发下一代国防机器人,挑战行业巨头。创始人DK Lee曾联合创立MarqV。南韩国防企业订单积压达690亿美元,投资加速推动其在全球市场地位提升,尤其加强与欧洲防务合作。
宇树科技推出以轮式人形机器人G1-D为核心的全栈解决方案,集成数据采集、处理、标注、审核及资产管理功能,提供一站式AI模型开发支持,涵盖分布式训练、自定义模型开发与部署服务,兼容主流开源模型。
智元机器人发布的具身智能一站式开发平台,覆盖数据采集到模型推理全链路
专为社区维护者和开发者打造的智能答疑机器人解决方案。
智能答疑机器人解决方案,助力GitHub社区维护者和开发者
为与人类安全共存而开发的创新双臂机器人机制
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
$7.7
$30.8
200
-
Google
$0.7
$2.1
$17.5
Anthropic
$21
$105
Moonshot
$4
$16
256
Xai
$1.4
$10.5
Deepseek
$12
128
$0.4
$8.75
$70
400
$0.35
$0.63
$3.15
131
Alibaba
$1
$525
Bytedance
$0.8
$8
Chatglm
Clemylia
梅尔塔是一款基于Discord机器人Melta27开发的独特小型语言模型,具有可爱、迷人和充满热情的个性特点,专门用于生成原创、独特且可爱的文本内容。
nvidia
NVIDIA GPT-OSS-120B Eagle3是基于OpenAI gpt-oss-120b模型的优化版本,采用混合专家(MoE)架构,具备1200亿总参数和50亿激活参数。该模型支持商业和非商业使用,适用于文本生成任务,特别适合AI Agent系统、聊天机器人等应用开发。
lerobot
π₀.₅是由Physical Intelligence开发的视觉-语言-动作模型,具备开放世界泛化能力,能够在训练时从未见过的全新环境和场景中执行机器人任务。
allenai
MolmoAct是由艾伦人工智能研究所开发的开源机器人操作动作推理模型,基于Qwen2.5-7B和SigLip2视觉骨干网络构建,专门针对家庭和桌面环境中的单臂Franka机器人操作任务进行优化。
MolmoAct是由艾伦人工智能研究所开发的全开源机器人操作动作推理模型,基于Qwen2.5-7B和SigLip2视觉骨干网络构建,专门用于家庭和桌面环境中的机器人操作任务。
MolmoAct是由艾伦人工智能研究所开发的开源动作推理模型,专门用于机器人操作任务。该模型基于Qwen2.5-7B和SigLip2构建,在家庭和桌面环境中的93种操作任务上训练,具有领先的视觉-语言-动作处理能力。
MolmoAct是由艾伦人工智能研究所开发的开源动作推理模型,专门用于机器人操作任务。该模型基于Qwen2.5-7B和SigLip2视觉骨干网络,在家庭和桌面环境中的93种独特操作任务上训练,具有领先的视觉-语言-动作推理性能。
Cosmos-Predict2.5是NVIDIA开发的专为物理AI设计的高性能预训练世界基础模型套件,基于扩散模型技术,能够根据文本、图像或视频输入生成具有物理感知的高质量图像和视频,为自动驾驶、机器人等应用提供世界模拟能力。
unsloth
Cosmos-Reason1是NVIDIA开发的物理人工智能模型,具备理解物理常识的能力,能通过长链思维推理生成具身决策。该模型支持多模态输入(文本+视频/图像),输出为文本,适用于机器人、自动驾驶等物理AI领域。
rogerxi
Spatial-LLaVA-7B是基于LLaVA模型微调的多模态模型,专注于提升空间关系推理能力,适用于多模态研究和聊天机器人开发。
OpenBuddy
专为增强量化推理能力优化的多语言聊天机器人,支持8种语言,基于Qwen/QwQ-32B模型开发
etri-lirs
EAGLE是韩国电子通信研究院(ETRI)开发的31亿参数解码器因果语言模型,专注于STEM领域特别是数学和定量推理。该模型经过7200亿标记的预训练,采用LLaMA兼容架构,但并非通用语言模型,需要额外微调才能用于聊天机器人等应用。
instructlab
Granite-7b-lab是由IBM研究院开发的大语言模型,基于Granite-7b-base模型,采用LAB(大规模聊天机器人对齐)方法训练而成,专注于文本生成任务。
cjpais
LLaVA 1.6 34B是一个开源的多模态聊天机器人模型,通过在多模态指令遵循数据上微调大语言模型开发而成。支持图像文本生成文本任务。
Lin-Chen
ShareGPT4V-7B是基于高质量图文对数据集微调的视觉主干模型,主要用于多模态研究和聊天机器人开发。
lmsys
Vicuna是一个基于LLaMA微调的聊天助手模型,通过在ShareGPT收集的用户共享对话上进行有监督指令微调训练得到。该模型主要用于大语言模型和聊天机器人的研究,由LMSYS开发并采用非商业许可证。
deepparag
Aeona是一款基于DialoGPT-small开发的生成式AI聊天机器人,专注于自然对话交互,支持上下文记忆和个性化回复
这是一个包含大量开源AI项目的列表,涵盖了从自然语言处理、图像生成到自动化工作流等多个领域。这些项目旨在帮助开发者利用AI技术构建各种应用,包括聊天机器人、代码生成工具、数据处理系统等。
科沃斯推出的扫地机器人控制MCP Server,是全球首个兼容MCP协议的机器人服务,提供设备查询、清扫控制、回充控制和工作状态查询四大核心功能,大幅降低智能体应用开发门槛。
一个基于Spring Boot和Spring AI的餐厅预订系统,通过API优先方法开发,整合了OpenAPI生成的客户端代码和AI聊天机器人功能,支持多种LLM服务提供商。