无界动力完成3亿元天使融资,红杉中国、线性资本领投,多家机构跟投。公司累计融资超5亿元,专注研发机器人“通用大脑”与“操作智能”,攻克手眼脑协同技术,提供软硬一体具身智能解决方案。
Generalist公司发布GEN-0基础模型,揭示机器人缩放定律,推动技术从任务定制迈向通用智能。该模型基于27万小时真实世界数据训练,实现跨硬件平台“边想边做”能力,被喻为机器人领域的“ChatGPT时刻”,强调真实数据优于模拟环境。
宇树科技推出“Embodied Avatar”系统,实现人类远程操控实体机器人。通过高精度动作捕捉和毫秒级远程控制,用户可实时驱动机器人完成拳击、舞蹈等复杂动作,达成“所动即所行”的具身智能体验。核心在于全链路低延迟动作映射技术。
上海AgiBot公司突破工业自动化技术,仅需10分钟即可教会机器人完成复杂制造任务。该技术融合人机远程操作与强化学习,工人先远程引导,AI系统随后接管优化,实现自我改进,有望重塑全球制造业生产方式。
每日更新AI研究新闻,涵盖多领域,用通俗语言解释
Clone是一款具有革命性人工肌肉技术Myofiber的类人机器人,能够自然行走。
Aria Gen 2 是一款用于机器感知、情境 AI 和机器人研究的新型智能眼镜。
Helix 是一款用于通用人形机器人控制的视觉-语言-行动模型。
AdilZtn
SmolVLA是一款紧凑高效的视觉语言动作模型,能在降低计算成本的情况下取得有竞争力的性能,并可以部署在消费级硬件上。该模型使用LeRobot进行训练,专为机器人技术应用设计。
adityak74
MEDFIT-LLM-3B是一个专门针对医疗问答优化的语言模型,基于Meta的Llama-3.2-3B-Instruct进行微调。该模型通过LoRA技术在医疗数据集上训练,显著提升了医学领域理解和直接回答能力,适用于医疗聊天机器人、患者教育等应用场景。
NiryoTeam
SmolVLA是一个紧凑且高效的视觉语言动作模型,能够在降低计算成本的情况下实现有竞争力的性能,并可以部署在消费级硬件上。该模型通过LeRobot进行训练,专为机器人技术任务设计。
GeniusJunP
SmolVLA是一个紧凑高效的视觉-语言-动作模型,能够在降低计算成本的情况下保持有竞争力的性能,适合部署在消费级硬件上。该模型使用LeRobot框架进行训练,专门针对机器人技术任务优化。
SmolVLA是一个紧凑高效的视觉-语言-动作模型,能在降低计算成本的情况下取得有竞争力的性能,可部署在消费级硬件上。该模型使用LeRobot框架训练,专为机器人技术应用设计。
nvidia
Cosmos-Predict2.5是NVIDIA开发的专为物理AI设计的高性能预训练世界基础模型套件,基于扩散模型技术,能够根据文本、图像或视频输入生成具有物理感知的高质量图像和视频,为自动驾驶、机器人等应用提供世界模拟能力。
NVIDIA Qwen3-30B-A3B FP4是阿里巴巴Qwen3-30B-A3B模型的量化版本,采用优化的Transformer架构,通过FP4量化技术将模型大小减少约3.3倍,同时保持较好的性能表现。该模型支持商业和非商业用途,适用于AI代理系统、聊天机器人、RAG系统等应用场景。
therarelab
一个基于PyTorch的动作识别模型,适用于机器人技术领域
lerobot
π0+FAST 是一种面向机器人技术的高效动作标记化方案,由Physical Intelligence设计,适用于视觉-语言-动作任务。
moojink
OpenVLA-OFT 是一个经过优化的视觉-语言-动作模型,专为机器人任务设计,通过微调技术提升了速度和成功率。
ConnorJiang
一个基于PyTorch的动作控制模型,适用于机器人技术领域
lerobot 是一个专注于机器人技术的 PyTorch 模型,集成了动作生成和模型中心混合功能。
Stanford-ILIAD
MiniVLA是一个视觉语言动作模型,专注于机器人技术领域,支持图像文本到文本的多模态任务。
MiniVLA是一个更小体积但性能优异的视觉语言动作模型,兼容Prismatic VLMs训练脚本,适用于机器人技术和多模态任务。
MiniVLA是一个10亿参数规模的视觉语言模型,与棱镜视觉语言模型项目代码库兼容,适用于机器人技术和多模态任务。
TrossenRoboticsCommunity
一个基于PyTorch的动作控制模型,专注于机器人技术领域的动作控制任务。
mihdalal
基于机器学习的机器人操作任务运动规划系统,结合神经网络与优化技术生成无碰撞运动轨迹
jimyoung6709
基于机器学习的机器人操作任务运动规划系统,结合神经网络与优化技术生成高效无碰撞轨迹
基于机器学习的机器人操作任务运动规划系统,结合神经网络与轻量级优化技术生成高效无碰撞轨迹
openvla
该模型是通过在LIBERO-10数据集上采用LoRA方法微调OpenVLA 7B模型得到的视觉语言动作模型,适用于机器人技术领域。
这是一个包含大量开源AI项目的列表,涵盖了从自然语言处理、图像生成到自动化工作流等多个领域。这些项目旨在帮助开发者利用AI技术构建各种应用,包括聊天机器人、代码生成工具、数据处理系统等。