OpenAI的AI动力机器人学会了如何单手解决魔方
人工智能研究组织OpenAI在构建通用自学机器人方面取得了新的里程碑。该组织的机器人部门说,Dactyl是去年首次开发的类人机器人手,已经学会了单手解决魔方的问题。OpenAI将这一壮举视为机器人附件灵巧性及其自己的AI软件的飞跃,这使Dactyl可以在面临实际挑战之前,利用虚拟仿真学习虚拟任务中的新任务。
在演示Dactyl的新才能的演示视频中,我们可以看到机器人手笨拙而准确地操纵着自己的手,朝着完整的立方体求解的方向摸索。这需要花费几分钟,但Dactyl最终能够解决难题。看到动作实在有些令人不安,这仅仅是因为动作看上去比人的动作明显少,并且与人类速记员在几秒钟内解决多维数据集时所显示的致盲速度和原始灵巧性相比,动作尤为明显。
但是对于OpenAI而言,Dactyl的成就使它更接近了更广泛的AI和机器人行业所追求的目标:可以学习执行各种现实任务的机器人,而无需经过数月至数年的训练实际时间,而无需进行专门编程。
“大量的机器人可以非常快速地解决Rubik的多维数据集。他们在这里所做的事情与我们在这里所做的事情之间的重要区别在于,这些机器人是专门制造的。” OpenAI的研究科学家兼机器人负责人Peter Welinder说。“显然,您无法使用相同的机器人或相同的方法来执行其他任务。OpenAI的机器人团队的野心截然不同。我们正在尝试构建通用机器人。与人类以及人类的手能做很多事情(不仅是一项特定任务)相似,我们正在尝试构建一种范围更广的东西。”
在过去的几年中,Welinder引用了一系列机器人,这些机器人使Rubik的多维数据集求解远远超出了人类的双手和思维范围。2016年,半导体制造商英飞凌开发了一款专门用于以超人的速度解决魔方的机器人,该机器人在不到一秒钟的时间内就做到了这一点。那打破了当时不到五分之二的人类世界纪录。两年后,麻省理工学院开发的机器在不到0.4秒的时间内解决了一个立方体。在2018年末,日本YouTube频道名为Human Controller甚至使用连接到可编程伺服电机的3D打印核心开发了自己的自解魔方。
多年来,机器已经能够以超人的速度解决魔方
换句话说,为一个特定任务而构建的机器人,并被编程为尽可能高效地执行该任务通常可以使人类受益,而Rubik的立方体求解是软件早已掌握的东西。因此,开发一个机器人来解决立方体,甚至是人形机器人,本身并不是那么出色,而且以Dactyl运转缓慢的速度就更是如此。
但是,OpenAI的Dactyl机器人和为其提供动力的软件在设计和用途上与专用的立方体求解机有很大不同。正如Welinder所说,OpenAI正在进行的机器人工作并非旨在在狭窄的任务中取得优异的结果,因为这只需要您开发更好的机器人并对其进行相应编程。这可以在没有现代人工智能的情况下完成。
取而代之的是,Dactyl是一种自学式的机器人手,可以像人类一样处理新任务。它使用软件进行培训,目前该软件以一种基本的方式尝试复制数百万年的演变,帮助我们学习从小就凭本能来使用自己的双手。OpenAI希望有一天可以帮助人类发展我们只能从科幻小说中了解到的类人机器人,这种机器人可以安全地在社会中运行而不会危害我们,并且可以在城市街道和工厂车间等混乱的环境中执行各种任务。
为了学习如何单手解决魔方,OpenAI并未明确编写Dactyl来解决玩具。互联网上的免费软件可以为您做到这一点。它还选择不对要执行的手的单个动作进行编程,因为它希望自己识别这些动作。取而代之的是,机器人团队为手的底层软件提供了解决混乱的多维数据集的最终目标,并使用了现代化的AI(特别是一种基于激励的深度学习品牌,称为强化学习)来帮助其自行解决。培训AI代理人的相同方法是OpenAI开发其世界一流的Dota 2机器人的方法。
但是直到最近,训练一个AI代理虚拟地做某事(例如玩计算机游戏)要比训练它执行真实任务要容易得多。这是因为可以加快在虚拟世界中执行某项任务的培训软件的速度,从而得益于成千上万的高端CPU和超高性能,AI可以在短短几个月的真实世界中花费数万年的培训时间强大的GPU并行工作。
用物理机器人进行相同水平的培训来执行物理任务是不可行的。这就是为什么OpenAI试图在模拟环境中代替现实世界中率先采用新的机器人培训方法的原因,而机器人行业几乎没有尝试过这种方法。这样,该软件可以同时在许多不同的计算机上以加速的速度进行广泛的练习,希望它在开始控制真正的机器人时保留这些知识。
OPENAI的DACTYL机器人手由AI软件提供动力
由于培训限制和明显的安全隐患,当今商业上使用的机器人不再使用AI,而是使用非常具体的指令进行编程。“过去采用这种方法的方式是,您使用非常专门的算法来解决任务,在此您可以对机器人和运行环境进行精确建模,” Welinder说。“对于工厂机器人,您拥有非常精确的模型,并且您确切地知道您正在工作的环境。您确切知道它将如何拾取特定部分。”
这也是为什么当前的机器人比人类的通用性要差得多的原因。对组装例如汽车或计算机组件的一个特定部分的机器人进行其他操作的机器人进行重新编程需要大量的时间,精力和金钱。提出一个机器人,即使是涉及任何水平的人类敏捷或视觉处理的简单任务,也都没有经过适当的培训,这将导致严重的故障。但是,借助现代AI技术,机器人可以像人类一样建模,以便他们可以使用对世界的直觉理解来完成从开门到煎蛋的一切工作。至少那是梦想。
我们距离这种复杂的水平还差几十年,而且AI社区在软件方面取得的飞跃(例如自动驾驶汽车,机器翻译和图像识别)还没有完全转换为下一代机器人。目前,OpenAI只是试图模仿人体一个部位的复杂性,并使该机器人模拟物更加自然地运转。
这就是Dactyl是仿照人手建模的24关节机器人手的原因,而不是您在工厂中看到的爪形或钳式机器人抓手。对于支持Dactyl来学习如何以人类方式利用所有这些关节的软件,OpenAI在尝试解决物理立方体问题之前,已对其进行了数千年的模拟培训。
“如果您要在现实世界中的机器人上进行训练,那么显然,无论您学到的是什么,都在研究您实际想要在其上部署算法的东西。这样,它就简单得多。但是当今的算法需要大量数据。训练一个现实世界的机器人,做任何复杂的事情,都需要多年的经验。” Welinder说。“即使对于一个人来说,也要花费几年的时间,并且人类拥有数百万年的进化才能拥有学习操作手的能力。”
然而,在仿真中,Welinder说可以像在玩游戏和以AI基准为基准的其他任务一样加速训练。“这需要数千年的时间来训练算法。但这只需要几天时间,因为我们可以并行进行培训。在训练这些算法时,您也不必担心机器人会损坏或伤害某人。”他补充道。但是,过去,研究人员在尝试进行虚拟训练以在物理机器人上工作时遇到了相当大的麻烦。OpenAI表示,它是最早真正看到这方面进展的组织之一。
当给它一个真实的立方体时,Dactyl便将其培训投入使用并自行解决,并且它在从未明确培训过的各种条件下进行了培训。这包括用一只手戴着手套的多维数据集解开,用两只手指将其绑在一起,同时OpenAI成员通过用其他物体戳它并用泡沫和像纸屑一样的纸屑淋洗来不断干扰它。
在通过模拟测试其技能之前,OPENAI使用模拟对DACTYL进行了数千年的培训
“我们发现,在所有这些干扰中,机器人仍然能够成功旋转魔方。但这并没有在训练中得到解决。” Welinder的OpenAI机器人团队负责人Matthias Plappert说。“当我们在物理机器人上尝试此功能时,发现的坚固性令我们感到惊讶。”
这就是为什么OpenAI认为Dactyl的新技能对于机器人硬件和AI培训的发展同等重要。即使是世界上最先进的机器人,例如行业领导者Boston Dynamics开发的类人机器人和类似狗的机器人,也无法自主运行,并且它们需要进行大量特定于任务的编程并需要频繁的人工干预才能执行基本动作。
OpenAI表示,Dactyl是迈向这类机器人的一个很小但至关重要的步骤,这种机器人可能有一天可以执行体力劳动或家务劳动,甚至可以与人类一起工作,而不是在封闭的环境中进行操作,而无需任何明确的程序来控制它们的动作。
在对未来的愿景中,机器人学习新任务并适应不断变化的环境的能力将与AI的灵活性和物理机的健壮性一样重要。“这些方法真的开始证明它们是解决我们所生活的物理世界的所有内在复杂性和混乱性的解决方案,” Plppert说。