一种理解对称性加速材料研究的新型神经网络
低维均匀流形近似投影,以可视化神经网络如何学习自然图像的语义相似性。图片来源:约书亚琼脂/利哈伊大学
理海大学材料科学与工程系教员 Joshua Agar 表示,了解结构-性能关系是材料研究的一个关键目标。然而,由于结构的复杂性和多维性质,目前尚无衡量标准来理解材料的结构。
Agar 说,人工神经网络是一种机器学习,可以通过训练来识别相似性——甚至关联结构和特性等参数——但存在两个主要挑战。一是材料实验产生的大量数据大部分从未被分析过。这主要是因为这些由世界各地实验室的科学家制作的图像很少以可用的方式存储,并且通常不会与其他研究团队共享。第二个挑战是神经网络在学习对称性和周期性(材料结构的周期性)方面不是很有效,这两个特征对材料研究人员来说至关重要。
现在,由利哈伊大学领导的团队开发了一种新颖的机器学习方法,可以通过机器学习创建相似性投影,使研究人员能够首次搜索非结构化图像数据库并识别趋势。Agar 和他的合作者开发并训练了一个神经网络模型,以包含对称感知特征,然后将他们的方法应用于加州大学伯克利分校五年来在不同材料系统上收集的一组 25,133 张压电响应力显微镜图像。结果:他们能够将相似类别的材料组合在一起并观察趋势,形成了开始理解结构-性能关系的基础。
“我们工作的一个新颖之处在于我们构建了一个特殊的神经网络来理解对称性,我们将其用作特征提取器,以使其更好地理解图像,”该论文的主要作者 Agar 说。描述:“材料显微镜的对称感知递归图像相似性探索”,今天发表在npj Computational Materials 上。除了 Agar 之外,作者还包括来自 Lehigh 大学的 Tri NM Nguyen、Yichen Guo、Shuyu Qin 和 Kylie S. Frew,以及来自斯坦福大学的 Rujuan Xu。主要作者 Nguyen 是利哈伊大学的本科生,现在正在攻读博士学位。在斯坦福。
该团队能够通过采用统一流形近似和投影 (UMAP)(一种非线性降维技术)来进行预测。Agar 说,这种方法使研究人员能够“......以一种模糊的方式学习数据的拓扑和更高级别的结构,并将其压缩为二维。”
“如果你训练一个神经网络,结果是一个向量,或者一组数字,它们是特征的紧凑描述。这些特征有助于对事物进行分类,以便学习一些相似性,”Agar 说。“然而,所产生的空间仍然相当大,因为你可能有 512 个或更多不同的特征。所以,你想把它压缩成一个人类可以理解的空间,比如 2D 或 3D——或者,也许是 4D .”
通过这样做,Agar 和他的团队能够拍摄 25,000 多张图像,并将非常相似的材料组合在一起。
“材料中相似类型的结构在语义上很接近,而且可以观察到某些趋势,特别是如果你应用一些元数据过滤器,”Agar 说。“如果你开始过滤谁做了沉积,谁制造了材料,他们试图做什么,材料系统是什么......你真的可以开始改进并获得越来越多的相似性。然后可以将这种相似性联系起来到其他参数,如属性。”
这项工作展示了改进的数据存储和管理如何快速加速材料发现。根据琼脂,失败的实验产生的图像和数据特别有价值。
“没有人发表失败的结果,这是一个巨大的损失,因为几年后有人会重复同样的实验,”Agar 说。“所以,你在一个可能行不通的实验上浪费了非常好的资源。”
Agar 说,与其丢失所有这些信息,还可以使用已经收集的数据来生成以前从未见过的新趋势,并以指数方式加速发现。
这项研究是橡树岭国家实验室名为DataFed的创新型数据存储企业的第一个“用例” 。根据其网站,DataFed 是“……一个联合的、大数据存储、协作和全生命周期管理系统,用于分布式高性能计算 (HPC) 和/或云中的计算科学和/或数据分析- 计算环境。”
“我在 Lehigh 的团队一直参与 DataFed 的设计和开发,使其与科学用例相关,”Agar 说。“Lehigh 是这个完全可扩展系统的第一个实时实现。它是一个联合数据库,因此任何人都可以弹出自己的服务器并绑定到中央设施。”
Agar 是利哈伊大学纳米人机界面计划团队的机器学习专家。该跨学科计划整合了社会科学和工程学,旨在改变人类与科学发现工具互动的方式,以加速创新。
“Lehigh 的纳米/人机界面计划的主要目标之一是将相关信息放在实验者的指尖,以提供可操作的信息,从而做出更明智的决策并加速科学发现,”Agar 说。“人类的记忆和回忆能力有限。DataFed 是现代的 Memex;它提供了可以轻松找到和回忆的科学信息的记忆。”
DataFed 为从事跨学科团队科学的研究人员提供了一个特别强大和宝贵的工具,允许在不同/偏远地点合作进行团队项目的研究人员访问彼此的原始数据。这是我们促进科学发现的利哈伊纳米 / 人机界面 (NHI) 计划的关键组成部分之一,”铝业基金会利哈伊大学材料科学与工程系教授兼纳米 / 人机界面主任 Martin P. Harmer 说倡议。