对机器人的图灵测试将判断类人机器人的逼真程度
艾伦·图灵(Alan Turing)最近被宣布成为新版50英镑纸币的头像,因为他在二战期间为破解密码做出了贡献,并奠定了计算机科学的基础。然而,图灵的工作仍然挑战和激励着许多人,尤其是那些在机器人和人工智能领域工作的人。
1950年,他提出了“机器会思考吗?”的问题,并提出了一种测试方法,研究人员至今仍将其作为一种判断计算机是否可以像人类一样被视为真正的智能的方法。但是,在一个自动机器人刚刚起步的时代,图灵测试只是用来评估人工大脑,而不是一个完整的人工人。
现在我们有了越来越逼真的机器人,我们需要一个21世纪版本的测试。我和我的同事们设计了一个“多模态图灵测试”来判断机器的外观、运动、声音和我们所说的嵌入式人工智能(EAI)。这是一个衡量人工智能如何与机器人身体整合以表达个性的标准。
这意味着我们可以系统地将一个类人机器人与一个活的同类机器人进行比较。通过这种方式,我们可以提出这样一个问题:“我们能否制造出在感知上与人类难以区分的机器人?”
图灵认为,如果一个电脑程序可以欺骗超过30%的人,让他们相信它在现实世界中是有知觉的,那么它实际上就和人类的思维没有区别——它可以思考。2014年,一台电脑通过了这项测试。这并不意味着我们没有工作去创造真正的人工智能。远非如此。但是图灵测试给了我们一个基准来判断我们的进步。
许多学者认为,创造一个与真人无异的人形机器人是机器人技术的最终目标。然而,目前还没有标准的方法来评估机器人到底有多逼真,所以不可能对这一发展进行基准测试。
像图灵一样,我们并不是说机器人可以复制人类的条件,然后变成有机生物。但是,如果一个机器人的出现、行为和功能在现实世界中与人类难以区分,那么它实际上可以被视为与人类一样。
对于栩栩如生的机器人制造者来说,最大的挑战之一就是克服所谓的“恐怖谷”。这指的是机器人在外观上越来越接近人类,但实际上却因为不太正确而让人更反感的发展阶段。问题是,传统的评估问题的方法没有细致入微地确定为什么机器人会让人感到不舒服。
这些方法倾向于将机器人作为一个整体与人类进行比较,而不是将其分解为各个部分的特征。例如,一个在其他方面看起来很真实的机器人的眼睛运动中的一个微小的计算错误会泄露整个游戏。其他面部区域的高质量特征则成为失败的一部分。
我们的想法是一步一步地评估每一个区域。只要每个特征都被设计成是同一身体的一部分(相同的性别、年龄等),那么如果一只眼睛和一张嘴可以单独通过测试,那么它们也应该一起通过测试。这将允许机器人建造者评估他们的进展,以确保身体的每个部分都与人类的没有区别,并防止最终某些东西落入恐怖谷。
我们的测试也被组织成四个阶段,每个阶段都比最后一个阶段更难,这代表了我们所说的“人类仿真的层次”。首先,机器人在静止时必须看起来很真实。其次,它必须以一种自然的方式移动。第三,它必须在外观和动作方式上对物理语言进行逼真的模拟。
最后是对具身人工智能的测试,评估机器人是否能够通过真实地表达情感来对世界做出反应,从而与人类进行自然的互动。如果一个人形机器人可以同时通过所有四个等级的测试,那么它在感知上与人类没有区别。
“我们只能看到前方很短的距离,但我们可以看到有很多事情需要做。”今天,这句话就像图灵在1950年说的一样准确。然而,机器人工程师比以往任何时候都更接近实现他们的目标,一个现实的类人机器,2017年见证了世界上第一个机器人公民的就职典礼。
今天,我们有工具来开发具有越来越逼真的外观、动作、语言和EAI的类人机器人。但是我们的多模态图灵测试为工程师提供了一种方便的方法来评估和改进他们的工作。
就像图灵最初的测试一样,我们的方法提出了一个问题:当我们无法区分真实的人和人造的人时,作为一个人意味着什么?试图过早地回答这些问题,因为我们想要比实际进步得更快,这可能会导致错误,比如将法律权利授予一台与现实相去甚远的机器。但我们开发的类人机器人越多,我们就越了解自己的价值观,甚至我们的情感。