Best Paper Award, ICRA 2019
[pdf] [site] [ppt]
摘要
在非结构环境中,多接触操作任务(Contact-rich manipulation tasks)通常同时需要触觉和视觉反馈,通常手动设计结合不同特征的模式的控制器并非易事。深度强化学习(DRL),在高维输入下学习控制策略已经取得了成功,由于样本复杂性,这些算法通常难以在真实机器人上部署。我们使用自监督,去学习传感器数据的紧凑和多模态表示,然后可以用来提高我们的策略学习的样本效率。我们在栓钉插入任务上评估了我们的方法,对不同的几何形状,配置和间隙进行推广,同时对外部扰动具有鲁棒性。我们在仿真和真实机器人上呈现效果。
介绍
主要贡献有:
- 多模态表示学习模型,可以从中学习多接触操作策略。
- 插入任务的示范,有效地利用触觉和视觉反馈进行孔搜索,栓钉对齐和插入(参见Fig.1)。烧蚀研究比较了每种模态对任务表现的影响。
- 评估具有不同栓钉几何形状的任务的泛化,以及对扰动和传感器噪声的鲁棒性。