微创机器人依托自主研发的“神经元 MicroGenius”大模型,成功完成全球首例大模型驱动的自主手术动物实验。实验在图迈手术机器人平台上进行,对30公斤实验猪实施了胆管夹闭与剪切等关键步骤,全程由AI技术自主完成,标志着手术自主化技术的重大突破。
微创机器人公司成功完成全球首例“大模型自主手术”动物实验,标志着手术机器人进入“自主驱动”新纪元。该实验基于自主研发的“神经元 MicroGenius”多模态大模型,填补了该领域技术空白。
东南亚超级应用Grab收购中国AI机器人公司Infermove,旨在通过自主移动机器人技术强化其物流配送网络,特别是在“第一公里”和“最后一公里”环节,以应对东南亚地区不断增长的配送需求,提升物流自动化水平。
在CES2026展会上,由OpenAI投资的1X Technologies公司发布新一代家务人形机器人Neo。它融合大模型与具身智能技术,计划2026年在美国上市,2027年推向全球,成为继特斯拉Optimus等之后又一重要家用机器人产品。
每日更新AI研究新闻,涵盖多领域,用通俗语言解释
Clone是一款具有革命性人工肌肉技术Myofiber的类人机器人,能够自然行走。
Aria Gen 2 是一款用于机器感知、情境 AI 和机器人研究的新型智能眼镜。
Helix 是一款用于通用人形机器人控制的视觉-语言-行动模型。
Openai
$7.7
输入tokens/百万
$30.8
输出tokens/百万
200
上下文长度
Alibaba
$8
$240
52
Tencent
-
$0.4
128
Anthropic
$105
$525
Iflytek
$2
$0.7
$1.95
16
Google
$140
$280
32
$3
$9
$1.4
131
Stepfun
Deepseek
8
AdilZtn
SmolVLA是一款紧凑高效的视觉语言动作模型,能在降低计算成本的情况下取得有竞争力的性能,并可以部署在消费级硬件上。该模型使用LeRobot进行训练,专为机器人技术应用设计。
adityak74
MEDFIT-LLM-3B是一个专门针对医疗问答优化的语言模型,基于Meta的Llama-3.2-3B-Instruct进行微调。该模型通过LoRA技术在医疗数据集上训练,显著提升了医学领域理解和直接回答能力,适用于医疗聊天机器人、患者教育等应用场景。
NiryoTeam
SmolVLA是一个紧凑且高效的视觉语言动作模型,能够在降低计算成本的情况下实现有竞争力的性能,并可以部署在消费级硬件上。该模型通过LeRobot进行训练,专为机器人技术任务设计。
nvidia
NVIDIA Qwen3-8B FP4 模型是阿里巴巴Qwen3-8B模型的量化版本,采用优化的Transformer架构的自回归语言模型。该模型使用FP4量化技术,在保持性能的同时显著减少内存占用和计算需求,适用于AI智能体系统、聊天机器人、RAG系统等应用场景。
GeniusJunP
SmolVLA是一个紧凑高效的视觉-语言-动作模型,能够在降低计算成本的情况下保持有竞争力的性能,适合部署在消费级硬件上。该模型使用LeRobot框架进行训练,专门针对机器人技术任务优化。
SmolVLA是一个紧凑高效的视觉-语言-动作模型,能在降低计算成本的情况下取得有竞争力的性能,可部署在消费级硬件上。该模型使用LeRobot框架训练,专为机器人技术应用设计。
Cosmos-Predict2.5是NVIDIA开发的专为物理AI设计的高性能预训练世界基础模型套件,基于扩散模型技术,能够根据文本、图像或视频输入生成具有物理感知的高质量图像和视频,为自动驾驶、机器人等应用提供世界模拟能力。
NVIDIA Qwen3-30B-A3B FP4是阿里巴巴Qwen3-30B-A3B模型的量化版本,采用优化的Transformer架构,通过FP4量化技术将模型大小减少约3.3倍,同时保持较好的性能表现。该模型支持商业和非商业用途,适用于AI代理系统、聊天机器人、RAG系统等应用场景。
这是DeepSeek AI的DeepSeek V3-0324模型的量化版本,采用优化的Transformer架构,通过FP4量化技术显著减少了模型大小和GPU内存需求,适用于AI智能体系统、聊天机器人等多种AI应用场景。
therarelab
一个基于PyTorch的动作识别模型,适用于机器人技术领域
lerobot
π0+FAST 是一种面向机器人技术的高效动作标记化方案,由Physical Intelligence设计,适用于视觉-语言-动作任务。
moojink
OpenVLA-OFT 是一个经过优化的视觉-语言-动作模型,专为机器人任务设计,通过微调技术提升了速度和成功率。
ConnorJiang
一个基于PyTorch的动作控制模型,适用于机器人技术领域
lerobot 是一个专注于机器人技术的 PyTorch 模型,集成了动作生成和模型中心混合功能。
Stanford-ILIAD
MiniVLA是一个视觉语言动作模型,专注于机器人技术领域,支持图像文本到文本的多模态任务。
MiniVLA是一个更小体积但性能优异的视觉语言动作模型,兼容Prismatic VLMs训练脚本,适用于机器人技术和多模态任务。
MiniVLA是一个10亿参数规模的视觉语言模型,与棱镜视觉语言模型项目代码库兼容,适用于机器人技术和多模态任务。
TrossenRoboticsCommunity
一个基于PyTorch的动作控制模型,专注于机器人技术领域的动作控制任务。
mihdalal
基于机器学习的机器人操作任务运动规划系统,结合神经网络与优化技术生成无碰撞运动轨迹
jimyoung6709
基于机器学习的机器人操作任务运动规划系统,结合神经网络与优化技术生成高效无碰撞轨迹
这是一个包含大量开源AI项目的列表,涵盖了从自然语言处理、图像生成到自动化工作流等多个领域。这些项目旨在帮助开发者利用AI技术构建各种应用,包括聊天机器人、代码生成工具、数据处理系统等。