▲马努埃利操作DON系统和库卡机器人抓取杯子。
灵巧一直是人类的标签。这种特性很大程度归功于眼睛的识别作用。在灵巧方面,机器人正在迎头赶上,并且已经取得了一些进展:它们可以在流水线等受控环境中重复捡起物品。研究人员在视觉系统上取得的突破使机器人能实现物体之间的基本区分。然而,机器人并不能对物体形状有真正意义上的“理解”,因此在快速拾取物品后,它们往往就无能为力了。
Sciencedaily.com网站9月11日报道,美国麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)的研究人员称,他们在机器人识别领域取得了关键进展。研究人员开发的 “密集对象网络”系统(简称DON)可使机器人检查随机物体,并使其在视觉上对物体有足够了解,从而完成特定任务。它甚至可以让机器人从一堆类似物品中挑出特定的物品。这对于亚马逊(Amazon)和沃尔玛(Walmart)等公司的仓库机器人来说很有价值。例如,操作人员操作DON系统让机器人抓住了鞋舌。从那以后,机器人可以抓住另一只从未见过的鞋子的鞋舌。博士生卢卡斯?马努埃利(Lucas Manuelli)说:“大多数系统都不能从多个方向上识别物体的特定部分。例如,现有算法很难使机器人准确抓住杯子的把手。而如果杯子的放置位置是多样的,那么对机器人来讲更是难上加难。”
DON系统不仅可以用于工业领域,还在家庭中有巨大的应用潜力。例如,给系统提供家里整洁时的图像,然后系统就能指挥机器人在你工作的时候将家里收拾得干干净净了。值得注意的是,系统具有“自我监督”的特点,无需人工注释的干预。
控制机器人实现抓取行为的两种常见方法为:特定任务学习和通用抓取算法。两种方法都存在一些问题:特定任务学习的扩展性能较差,而通用抓取算法在处理特定任务时对细节的处理缺乏准确性。反观DON系统,它本质上是针对给定对象创建一系列坐标,通过点映射形成对象的“视觉路线图”,最后通过拍照、识别和匹配等流程完成任务。MIT的DON系统与加州大学伯克利分校(简称UCB)的DexNet有所不同。DexNet系统虽然可以抓取很多物品,但不能满足特定需求。形象的对比是,DexNet是一个18个月的婴儿,他可以漫无目的地抓起很多玩具。而DON则是一个4岁的小朋友,他可以听从大人的命令,抓住红色玩具卡车车尾。
在抓取软体毛毛虫玩具的实验中,DON系统控制的库卡机器人可从不同角度抓住玩具的右耳。这说明系统可以辨别对称物体的左右。而在抓取棒球帽的实验中,DON系统指挥库卡机器人从帽子堆中成功抓取了特定的帽子。
马努埃利说:“在工厂里,机器人通常需要复杂的零件来确保工作的可靠性。但对于可以理解物体方向的DON系统,只需要拍几张照片,就能使机器人准确抓取物品了”。下一步,马努埃利等希望继续改进DON系统,使其能够执行特定任务,并对相应对象有更深入的了解,比如学习如何抓取一个对象并移动它。最终实现利用机器人清理桌面的目标。
科界原创
编译:雷鑫宇
审稿:alone
责编:张梦
责编:南熙