个性化的深度学习使机器人能够进行自闭症治疗
患有自闭症谱系条件的儿童往往难以识别周围人的情绪状态 - 例如,将幸福的脸与可怕的脸区分开来。为了解决这个问题,一些治疗师使用儿童友好型机器人来展示这些情绪,并让孩子们模仿情绪并以适当的方式对他们做出反应。
然而,如果机器人能够在治疗期间顺利地解释孩子自己的行为 - 无论他或她是否感兴趣或兴奋或注意力 - 这种类型的治疗效果最佳。麻省理工学院媒体实验室的研究人员现在开发了一种个性化的机器学习,帮助机器人在这些交互过程中使用该孩子独有的数据来估计每个孩子的参与度和兴趣。
凭借这种个性化的“深度学习”网络,科学家们在6月27日的“ 科学机器人”杂志上报告说,机器人对儿童反应的看法与人类专家的评估一致,相关分数为60%。
人类观察者对儿童的参与和行为达成高度一致意见可能具有挑战性。他们的相关分数通常在50%到55%之间。Rudovic和他的同事们提出,在本研究中,接受人类观察训练的机器人有朝一日可能会对这些行为提供更一致的估计。
“长期目标不是制造能够取代人类治疗师的机器人,而是通过治疗师可以用来个性化治疗内容的关键信息来增强它们,并在机器人和自闭症儿童之间进行更具吸引力和自然主义的互动, “媒体实验室的博士后Oggi Rudovic解释说,该研究的第一作者。
罗莎琳德皮卡德是该论文的合着者,也是麻省理工学院教授,主持情感计算研究,他说个性化在自闭症治疗中尤为重要:一句着名的谚语是:“如果你遇到一个人,患有自闭症,你就会遇到一个患有自闭症的人。“
“在自闭症中创建机器学习和AI [人工智能]的挑战尤其令人烦恼,因为通常的AI方法需要大量的数据,这些数据对于每个学习的类别都是相似的。在异质性占主导地位的自闭症中,正常的AI方法失败了,“皮卡德说。Rudovic,Picard和他们的队友也在其他领域使用个性化深度学习,发现它可以改善疼痛监测结果和预测阿尔茨海默病的进展。
会见NAO
机器人辅助治疗自闭症的方法通常是这样的:人类治疗师会显示不同面孔的儿童照片或闪卡,以表示不同的情绪,教他们如何识别恐惧,悲伤或喜悦的表情。治疗师然后对机器人进行编程以向孩子显示这些相同的情绪,并在孩子与机器人接触时观察孩子。孩子的行为提供了有价值的反馈,机器人和治疗师需要继续学习课程。
研究人员在这项研究中使用了SoftBank Robotics NAO人形机器人。NAO身高约2英尺,类似于装甲超级英雄或机器人,通过改变眼睛的颜色,四肢的运动和声音的语气来传达不同的情绪。
参与本研究的35名自闭症儿童,17名来自日本,18名来自塞尔维亚,年龄从3岁到13岁不等。他们在35分钟的会议期间以各种方式对机器人做出反应,在某些情况下看起来很无聊和困倦兴奋地跳着房间,拍手,笑着或触摸机器人。
研究中的大多数孩子对机器人的反应“不仅仅是作为一个玩具,而是与NAO有关,因为它是真实的人”,特别是在讲故事时,治疗师询问如果孩子们拿着机器人,NAO会感觉如何根据鲁多维奇的说法,这是一种冰淇淋。
一名4岁女孩在参加会议期间躲在母亲身后,但对机器人变得更加开放,并在治疗结束时笑了起来。塞尔维亚一个孩子的妹妹给了NAO一个拥抱,并在一次会议结束时说“机器人,我爱你!”,说她很高兴看到她哥哥多喜欢和机器人一起玩。
“治疗师说,让孩子接受几秒钟对他们来说可能是一个很大的挑战,机器人吸引了孩子的注意力,”Rudovic解释说,为什么机器人在这种治疗中很有用。“此外,人类以多种不同的方式改变他们的表达方式,但机器人总是以同样的方式做到这一点,这对孩子来说不那么令人沮丧,因为孩子以非常有条理的方式学习表达方式的显示方式。”
个性化机器学习
麻省理工学院的研究小组意识到,一种称为深度学习的机器学习对于治疗机器人来说有用,可以更自然地感知孩子的行为。深度学习系统使用分层的多层数据处理来改进其任务,每个连续层相当于原始原始数据的稍微抽象的表示。
尽管自20世纪80年代以来深度学习的概念已经出现,但Rudovic说,直到最近才有足够的计算能力来实现这种人工智能。深度学习已被用于自动语音和对象识别程序,使其非常适合于解决诸如面部,身体和声音的多重特征的问题,这些特征可用于理解更抽象的概念,例如儿童的订婚。
“例如,在面部表情的情况下,面部的哪些部分对于估计参与度最重要?”Rudovic说。“深度学习允许机器人直接从该数据中提取最重要的信息,而无需人工手动制作这些功能。”
对于治疗机器人,Rudovic和他的同事们进一步深入学习,并建立了一个个性化的框架,可以从每个孩子收集的数据中学习。研究人员从儿童手腕上的监视器上捕获了每个孩子的面部表情,头部和身体动作,姿势和手势,录音以及心率,体温和皮肤出汗反应数据的视频。
机器人的个性化深度学习网络是根据这些视频,音频和生理数据的层次,有关儿童孤独症诊断和能力,他们的文化和性别的信息构建的。研究人员随后将他们对儿童行为的估计与五名人类专家的估计进行了比较,他们对儿童的视频和录音进行了连续编码,以确定儿童在会议期间的兴趣和不满,感兴趣程度以及参与程度。
根据人类编码的这些个性化数据进行训练,并对未用于训练或调整模型的数据进行测试,网络显着改善了机器人对研究中大多数儿童的行为的自动估计,超出了估计的范围。研究人员发现,网络以“一刀切”的方式将所有儿童的数据结合起来。
Rudovic及其同事还能够探讨深度学习网络如何做出估计,从而揭示了孩子们之间一些有趣的文化差异。“例如,来自日本的儿童在高度接触期间表现出更多的身体动作,而在塞尔维亚人中,大量的身体动作与脱离事件有关,”Rudovic说。