麻省理工学院首次推出受大型语言模型启发的方法 用于教授机器人新技能
麻省理工学院本周展示了一种训练机器人的新模型,旨在解决模仿学习在引入小挑战时可能会失败的问题。研究人员指出,模仿学习在照明、不同环境或新障碍等情况下可能会失败,因为机器人根本没有足够的数据来适应。该团队寻求像 GPT-4这样的模型来寻找一种强力数据方法来解决问题。他们引入了一种名为异构预训练变压器(HPT)的新架构,该架构将来自不同传感器和不同环境的信息汇集在一起。然后使用变压器将数据汇总到训练模型中。变压器越大,输出越好。用户可以输入机器人