OpenAI的机械手为Rubik的立方体做出了动作
那些知道让机器人的手抓住,操纵和操纵有多么艰辛的人,不仅仅看一眼-而是凝视着-在最近的展示了OpenAI Dactyl Rubik立方体的视频中。
当挑战在于证明人的手指灵巧性时,用四指拇指的机器人手工作绝非易事。OpenAI的手凭借其灵巧的手指操作赢得了赏心悦目的外观,这是人手解决立方体所需要的。
那些熟悉OpenAI去年发布的其他视频的人已经知道了他们的进步,该视频称为“学习敏捷”。视频是关于他们训练像人一样的机器人手来操纵物理对象的视频。即使那样,他们仍然觉得自己可以夸耀机器人手可以“前所未有的敏捷性”来做到这一点。
这就是他们介绍其系统Dactyl的方式。他们说,Dactyl使用通用强化学习算法和代码从头开始学习。“我们的结果表明,有可能在模拟中训练代理并让他们解决现实世界的任务,而无需对世界进行物理上精确的建模。”
一位机器学习工程师告诉视频观众,该技术被称为领域随机化。
他们随机化了例如手可以移动多快,块有多重以及块与手之间的摩擦。
一年前视频中的两个评论认为这并不是真正的AI:“'AI'在这一点上实际上只是抽象算法。我们甚至还不了解什么是智能,更不用说如何对其进行合成了。”
另一条评论是:“这无非是聪明的编程……根本没有智能。这只是一台机器,它以一种编程的方式来完成已被编程的工作。只需对事物进行编程,以正确的方式转动模块从一开始就为自己节省了时间和精力……计算机将永远只能按照编程的方式进行操作。”
尽管如此,《麻省理工学院技术评论》的Karen Hao仍认为,该团队的机械手是朝面向工业和消费类应用的更加敏捷的机器人迈出的重要一步。
快进他们的新论文“用机械手解决魔方”。
作者解释说:“我们证明,仅在模拟中训练的模型可用于解决实际机器人上前所未有的复杂性操作问题。这有两个关键因素:一种新颖的算法,我们称之为自动域随机化(ADR), )和为机器学习而构建的机器人平台。”
他们谈论了翻转和顶面旋转的组合。
“旋转对应于将魔方的单个面沿顺时针或逆时针方向旋转90度。翻转对应于将魔方的另一面移动到顶部。我们发现将顶面旋转得很远比旋转其他面更简单。因此,代替旋转任意面,我们将翻转和顶面旋转结合在一起以执行所需的操作。然后可以依次执行这些子目标,最终解决魔方。
他们怀疑任何人都以理想的混乱方块给自己带来不公平的优势。
“解决魔方的难度显然取决于之前被加扰的数量。我们使用世界多维数据集协会使用的官方加扰方法来获得他们所谓的公平加扰(大约20招用于解决了Rubik的立方体进行打乱的问题)。
其他机器人专家对OpenAI团队与Rubik的拼图游戏互动的看法如何?
郝引用密歇根大学的机器人专家德米特里·贝伦森(Dmitry Berenson)的话。
他说:“这是一个非常困难的问题。”“旋转魔方的零件所需的操作实际上比旋转魔方要困难得多。”
但是,当团队引用经过模拟训练的模型时,这意味着什么?麻省理工学院技术评论杂志的Karen Hao说,他们建立了机器人的虚拟模型。他们实际上训练它来完成手头的任务。“该算法学习了数字空间的安全性,之后可以移植到物理机器人中。”现在,成功的关键在于:Ho说:“实验室在每一轮训练中都对模拟条件进行了打乱,以使算法更适应各种可能性。”
他们使用(1)Shadow Dexterous E系列手作为机器人手,(2)PhaseSpace运动捕获系统跟踪指尖的笛卡尔坐标,以及(3)使用三个RGB Basler相机进行视觉姿势估计。
下一步是什么?
团队成员在博客中表示:“用机械手解决魔方的问题仍然不容易。目前,我们的方法在需要最大难度的扰动(需要26次面部旋转)的情况下,有20%的时间解决了魔方的问题。对于较简单的扰动,需要15次旋转才能撤消,成功率为60%。
尽管如此,OpenAI并不是要摆脱困难。“我们相信人类的灵巧性正在构建通用机器人的道路上,我们很高兴朝这个方向前进。”