教机器人开车,错误的演示也有用?

如何教机器人开车?研究人员有了新想法。

试想,如果机器人能够通过观看演示来学习新技能:在家,你可以教家庭机器人如何做家务;在办公室,你可以像培训新员工一样训练机器人完成工作任务;在路上,自动驾驶汽车也可以通过观察你的驾驶方式学习如何安全驾驶。

据techxplore.com网站近日报道,美国南加州大学(USC)的研究人员在自动驾驶方面取得了新进展。他们设计的系统可以让机器人从少量演示中自主学习复杂任务。

新系统通过评估演示过程的质量运行,因此,不论演示成功还是失败,机器人都能从中获益。相关论文在机器人学习大会(CoRL)中发布。

目前的学习方法至少需要上百次演示实验才能使机器人完成特定任务,而新系统通过少量演示就能达到相同效果。在它的帮助下,机器人能像人类相互学习那样,更自然地学习——观摩他人完成任务,再自行尝试,他人演示过程也不一定完美无误。

论文作者、USC计算机科学博士生Aniruddh Puranic说:“大多数人不具备编程知识,无法明确告诉机器人需要做什么。人类也不可能演示机器人需要了解的所有场景。”

研究人员在新系统中集成“信号时序逻辑”(STL),用以评估演示质量并自动对演示进行排名,产生内在激励。换句话说,即使根据逻辑需求,演示的某些部分没有任何意义,机器人仍可受益,因为该系统能够对一次演示的准确性(或成功程度)做出自己的判断。

“此前,如果机器人在学习过程中观看了错误演示,机器人有可能完全无视它,也有可能直接进行错误学习,”论文作者、USC计算机科学助理教授Stefanos Nikolaidis说,“相比之下,新系统更加智能,它通过逻辑形式推理理解了演示的好坏之分。从本质上讲,这和人类的做法一致。”

例如,在驾驶演示中,有人无视了停车标志,这一演示将被系统放在靠后排位。但是,如果驾驶员选择踩下刹车以避免碰撞,机器人则会学习这一相对明智的行为。

STL是一种具有表达能力的数学符号语言,它赋予系统自动推理结果(现在及未来)的能力。前丰田工程师、USC计算机科学助理教授Jyo Deshmukh表示,STL比此前使用的“线性时序逻辑”(LTL)更符合现代需求。他说:“当我们进入由自动驾驶汽车、机器人构建的新世界时,时间的重要性凸显。LTL繁杂耗时,因为它需要推断变量的真/假值序列,而STL允许对物理信号进行推理。”

系统的测试任务是在一款与《我的世界》风格类似的游戏模拟器中完成的,不过,研究人员表示,系统也可以通过驾驶模拟器进行学习,甚至从视频中学习。

Nikolaidis说:“如果我们想让机器人成为人类的好帮手,首先需要让它们进行有效学习,适应人类喜好。我们开发的系统正是以此为目标。”

版权声明:本文由科界平台原创编译,中文内容仅供参考,一切内容以英文原版为准。转载请注明来源科技工作者之家—科界App。