现实世界机器人抓取系统
某机构研究奖项获得者Russ Tedrake正在教机器人如何在陌生且不断变化的环境中操纵各种物体。
Russ Tedrake是麻省理工学院电气工程与计算机科学教授兼机器人运动小组负责人,他在2017年获得了首个某机构研究奖项(ARA)——这也是机器人技术被纳入ARA研究领域的第一年。
自我监督学习在机器人技术中的应用
通过连续获得ARA资助,Tedrake持续探索机器人抓取操作的挑战——即在任意空间配置中抓取和操纵物体。“抓取操作分为不同层次,“Tedrake表示,“最初级的是寻找大的平坦表面进行抓取,而不考虑物体特性。更高级的层次则需要理解物体的惯性分布,比如抓取厚重书本时,从中间抓起比从边缘抓起更合适。我们正尝试结合计算机视觉革命与控制理论,推动技术发展。”
在首个ARA项目中,Tedrake团队将自我监督学习应用于机器人抓取问题。该方法使用未标记数据训练机器学习模型,然后只需少量标记数据即可针对特定任务进行微调。
关键点对应关系建模
Tedrake团队的后续项目训练神经网络映射同类物体的关键点。他们首先使用自监督预训练的神经网络,然后使用各类物体实例(如各种形状的杯子和鞋子)进行微调。通过添加计算机生成的图像数据,模型能够学习类别级别的结构原理而非简单记忆形状。
测试显示,该系统在端到端抓取任务中达到99%的置信度。即使遇到训练集未包含的物体类型,只需将其加入训练集重新训练即可解决问题。
实时轨迹调整技术
为进一步提升系统鲁棒性,团队教机器人使用视频反馈实时调整轨迹。他们采用机器学习方法设计控制器,通过远程操作演示数据训练模型预测控制信号。经过约100次实验后,系统即使在被故意干扰的情况下也能稳定抓取物体。
目前团队正致力于开发通用化反馈模型,使机器人仅需少量示例就能学会处理干扰。Tedrake解释说:“我们从数据中学习动态模型而非直接学习策略,这需要结合机器学习与传统控制理论分析。”
运动规划算法创新
在最新研究中,Tedrake团队考虑最短路径问题的变体,其中图节点位置会按某种函数变化。虽然该问题是NP完全问题,但研究人员展示了如何有效找到近似解。
Tedrake强调:“虽然机器学习效果显著,但人们有时会过度依赖。在控制和优化领域,我们仍然掌握着许多有效方法,我正努力推动这些传统技术的边界。”