荣耀发布Magic8系列手机及MagicOS 10系统,标志其向AI终端生态公司转型。该系列以“自进化”为核心,旨在突破AI手机同质化竞争,抢占2025年市场爆发先机。
初创公司Bedrock Robotics与AWS合作,利用视觉语言模型(VLMs)解决了重型设备自动驾驶系统开发中的关键难题——海量视频数据标注。传统方法依赖人工标注数百万小时监控视频,而新技术显著提升了施工自动化系统的训练效率。
Carbon Robotics推出“大型植物模型”AI,作为激光除草机器人LaserWeeder的智能核心。该模型基于15个国家、100多个农场超1.5亿张高质量图像训练,具备深度植物结构理解能力,显著提升农田除草效率。
自动驾驶公司Waabi完成10亿美元融资,与Uber达成战略合作,业务从货运扩展至Robotaxi。融资包括7.5亿美元C轮和Uber的2.5亿美元投资。Waabi将在Uber平台部署至少2.5万辆自动驾驶出租车,使用其AI驱动技术。
用AI秒速创建个性化圣诞贺卡,首张免费,可印刷配送或发电子卡。
基于Gemini 2.0的机器人模型,将AI带入物理世界,具备视觉、语言和动作能力。
用于双手操作的扩散基础模型
特斯拉自动驾驶技术与机器人的未来愿景
Remade-AI
基于Wan2.1 14B I2V 480p模型训练的LoRA,可将任何图像主体转化为展现机器人面部的视频效果
RobotsMali
这是一个基于NVIDIA NeMo框架微调的班巴拉语自动语音识别模型,适用于处理班巴拉语语音转文本任务。
robotics-diffusion-transformer
RDT-170M是一个拥有1.7亿参数的模仿学习扩散Transformer模型,用于机器人视觉-语言-动作任务。
robotjagaek
一个基于PyTorch和HuggingPics构建的图像分类模型,专门用于识别不同种类的鞋子。
Ethan-pooh
基于robotics-diffusion-transformer/rdt-1b衍生的RDT模型,专注于机器人技术领域。
基于100万+多机器人操作数据预训练的10亿参数模仿学习扩散Transformer模型,支持多视角视觉语言动作预测
robotjung
专为生成半写实风格人物图像而打造的模型,经过多次模型融合优化。
ros2-mcp-server是一个基于Python的服务器,通过Model Context Protocol (MCP)与ROS 2集成,使AI助手能够通过ROS 2话题控制机器人运动。它支持时间控制的移动命令,并作为ROS 2节点运行,发布geometry_msgs/Twist消息到/cmd_vel话题。
将Robot Framework库转换为MCP服务器的指南,通过添加特定函数和配置,使库能够作为MCP服务运行,便于客户端调用。
这是一个Airbnb房源搜索和详情查询的MCP服务,提供结构化数据和直接链接,无需API密钥,遵守robots.txt规则。
一个基于FastMCP的机器人控制服务器项目,支持移动动作控制,未来将扩展导航功能。
Airbnb搜索与房源信息桌面扩展,提供高级搜索过滤功能和详细房源信息获取,支持位置搜索、日期筛选、价格区间等多种查询条件,并遵守robots.txt协议确保合规使用。