【论文精读】固定式Aloha-1.摘要
对于机器人来说,诸如穿扎带或插入电池等精细操作任务是众所周知的困难,因为它们需要精确度、接触力的仔细协调以及闭环视觉反馈。执行这些任务通常需要高端机器人、精确的传感器或仔细的校准,这些可能既昂贵又难以设置。学习能否使用低成本且不精确的硬件来执行这些精细的操作任务?
我们提出了一种低成本系统,可以直接从通过自定义远程操作界面收集的真实演示中执行端到端模仿学习。然而,模仿学习也面临着自身的挑战,特别是在高精度领域:策略中的错误可能会随着时间的推移而复合,而人类的演示可能是不稳定的。
为了应对这些挑战,我们开发了一种简单而新颖的算法,即 Action Chunking with Transformers(ACT),它学习动作序列的生成模型。 ACT 使机器人能够在现实世界中学习 6 项困难任务,例如仅需要10分钟的演示打开半透明调味品杯和插入电池,成功率高达 80-90%。
项目网站:https://tonyzhaozh.github.io/aloha/
项目中文网站:http://rosrobot.cn/?tags=73
图1:ALOHA:用于双手远程操作的低成本开源硬件系统。整个系统的成本不到2 万美元,采用现成的机器人和3D打印组件。
左:用户通过反向驱动领导者机器人进行远程操作,跟随者机器人镜像该运动。
右:ALOHA能够执行精确、接触丰富且动态的任务。我们展示了远程操作和学习技能的例子。