像幼儿一样机器人在学习如何在物理世界中工作时可以使用一点帮助
像幼儿一样,机器人在学习如何在物理世界中工作时可以使用一点帮助。这就是莱斯大学计划的目的,该计划温和地指导机器人朝着最有帮助的,类似于人的方式进行任务协作的方式。
稻米工程师Marcia O'Malley和研究生Dylan Losey通过在执行任务时对机器施加温和的物理反馈,完善了他们的机器人训练方法。目的是简化期望与人类并肩高效工作的机器人的培训。
“从历史上看,机器人的作用是接管我们不想做的普通任务:制造,装配线,焊接,喷漆,”机械工程,电气与计算机工程和计算机科学教授O'Malley说。“随着我们越来越愿意与技术共享个人信息,就像我的手表记录我所采取的步骤的方式一样,技术也将渗透到嵌入式硬件中。
她说:“机器人已经在我们家中吸尘或控制恒温器或修剪草坪。” “技术渗透到我们的生活中,有各种各样的方式。我已经在厨房里和Alexa聊天了,那么为什么还没有可以与我们进行物理协作的机器呢?我们的许多工作都是为了确保人机交互的安全性。”
根据研究人员的说法,适应于对人机交互(pHRI)做出反应的机器人传统上将此类交互视为干扰,并在交互结束时恢复其原始行为。赖斯大学的研究人员通过一种方法使人类能够实时地物理调整机器人的轨迹,从而增强了pHRI。
该程序的核心是阻抗控制的概念 ,实际上是一种管理推入时发生的情况的方法。允许通过物理输入进行阻抗控制的机器人会调整其编程轨迹以做出响应,但在输入结束时会返回其初始轨迹。
赖斯算法基于该概念,因为它允许机器人调整超出输入范围的路径并计算到达其目标的新路线,类似于GPS系统,当驾驶员错过转弯时,它会重新计算到达目的地的路线。
Losey去年夏天大部分时间都在加州大学伯克利分校电气工程和计算机科学助理教授Anca Dragan的实验室中进行 测试。他和其他学生训练了机械臂和手来将咖啡杯放在桌面上,然后使用增强的pHRI使其远离计算机键盘,并且足够低,以免摔落时杯子也不会破裂。(关于实验的另一篇论文发表在 《机器学习研究》中。)
目的是通过物理交互作用来改变机器人的编程轨迹。“在这里,机器人有一个计划或所需的轨迹,描述了机器人认为它应该执行任务的方式,” Losey在一篇有关伯克利实验的论文中写道 。“我们引入了一种实时算法,可以对机器人未来的期望轨迹进行修改或变形。”
在阻抗模式下,机器人在交互后始终返回其原始轨迹。Losey说,在学习模式下,反馈不仅改变了交互时机器人的状态,而且还改变了机器人如何达到目标。例如,如果用户指示它防止杯子越过键盘,它将来会继续这样做。他说:“通过在每次新观察后重新计划机器人的期望轨迹,该机器人能够产生与人类喜好相匹配的行为。”
进一步的测试雇用了10名莱斯大学的学生,他们使用了O'Malley实验室的康复力反馈机器人 OpenWrist来操纵光标绕过计算机屏幕上的障碍物并落在蓝点上。测试首先使用标准阻抗控制,然后使用具有物理交互轨迹变形的阻抗控制,这是pHRI的模拟,允许学生训练设备学习新的轨迹。
结果表明,轨迹变形试验在物理上更容易,并且需要更少的交互作用才能达到目标。实验表明,交互作用可以对具有多个自由度的自主机器人进行编程,在这种情况下,该机器人可以弯曲手臂并旋转手腕。
当前的局限性在于,pHRI尚无法修改机器人执行任务所花费的时间,但这已在Rice团队的议程上。
洛西说:“这项工作的范式转变是,机器人应该将人类视为有理性互动并试图传达重要信息的理性人,而不是将人类视为随机干扰。” “机器人不应该只是试图摆脱阻碍。它应该了解正在发生的事情,并更好地完成工作。”