目光敏锐的机器学习算法胜过人类专家
人工智能现在是如此的聪明,以至于硅脑经常比人更聪明。
电脑操作自动驾驶汽车,从Facebook上的照片中识别朋友的面孔,并正在学习承担通常只委托给人类专家的工作。
来自威斯康星大学麦迪逊分校(University of Wisconsin-Madison)和橡树岭国家实验室(Oak Ridge National Laboratory)的研究人员已经训练出了计算机,可以快速、持续地检测和分析核反应堆材料的微观辐射损伤。在这项艰巨的任务中,计算机战胜了人类。
“机器学习有很大的潜力,可以改变目前显微镜图像分析中涉及到人类的方法,”魏立(音译)说,他今年在威斯康辛大学麦迪逊分校获得了材料科学与工程硕士学位。
材料科学中的许多问题都是基于图像的,而在机器视觉方面的研究却很少,这使得图像识别和分析成为一个主要的研究瓶颈。作为一名学生,李意识到他可以利用最新的计算技术来帮助填补人工智能和材料科学研究之间的鸿沟。
李与橡树岭大学的科学家凯文·菲尔德和威斯康星大学麦迪逊分校的材料科学与工程教授戴恩·摩根一起,利用机器学习使人工智能在分析潜在核反应堆材料的损坏方面比有经验的人做得更好。合作者在7月18日的《npj计算材料》杂志上发表的一篇论文中描述了他们的方法。
机器学习使用统计方法来引导计算机提高它们在一项任务中的表现,而不需要从人类那里得到任何明确的指导。从本质上讲,机器学习教计算机自学。
“在未来,我相信许多仪器的图像将通过机器学习算法进行初步分析,然后才会被人类考虑,”李的研究生院顾问摩根说。
研究人员将机器学习作为一种快速筛选暴露在辐射下的材料的电子显微镜图像的方法,并识别出一种特定类型的损伤——这是一项具有挑战性的任务,因为这些照片可能类似于月球表面的陨石坑或喷溅的画布。
这项工作对开发安全的核材料至关重要,它可以使耗时的过程更加有效。
“人类检测和识别是容易出错、不一致和低效的。也许最重要的是,它是不可扩展的,”摩根说。“更新的成像技术正在超越人类分析数据的能力。”
以前,图像处理算法依赖于人类程序员来提供对象识别特征的显式描述。教计算机识别像停止标志这样简单的东西可能涉及到描述一个红色八角形物体的代码行。
然而,更复杂的是,要清楚地表达所有的视觉信号,例如,一只猫。模糊的耳朵?锋利的牙齿吗?胡须吗?许多小动物都有这些相同的特征。
机器学习现在采用了一种完全不同的方法。
“这是思维方式的真正改变。你不能制定规则。你让电脑来决定规则应该是什么,”摩根说。
今天的机器学习方法在图像分析中经常使用一种叫做神经网络的程序,这种程序似乎模仿了人类大脑非凡的分层模式识别能力。为了教会神经网络识别猫,科学家们只需“训练”程序,提供各种猫品种的精确标记图片集合。神经网络从那里接管,为最重要的特性建立和完善它自己的一套指导方针。
同样地,摩根和他的同事们教会了一个神经网络识别一种非常特殊的辐射损伤类型,称为位错环,这是一些最常见的,但也是最具挑战性的缺陷,即使是一个有几十年经验的人也很难识别和量化它。
经过270张图像的训练,神经网络与另一种称为级联目标探测器的机器学习算法相结合,在一组测试图像中正确识别和分类了大约86%的位错环。作为对比,人类专家发现了80%的缺陷。
“当我们得到最终结果时,每个人都很惊讶,”菲尔德说,“不仅是方法的准确性,还有速度。我们现在可以像人类一样探测这些循环,而在标准家用电脑上只需要几分之一的时间。”
毕业后,李在谷歌找了一份工作,但研究仍在进行中。摩根和菲尔德正在努力扩大他们的训练数据集,并教授一种新的神经网络来识别不同种类的辐射缺陷。最终,他们设想建立一个巨大的基于云的资源,供世界各地的材料科学家上传图像进行近乎即时的分析。
“这仅仅是个开始,”摩根说。“机器学习工具将有助于创建一个网络基础设施,科学家可以用我们刚刚开始了解的方式利用它。”