机器学习被用到了材料科学,能否高效解决费力的人力工作?

通过使用机器学习作为一种图像处理技术,科学家可以在不牺牲准确性的情况下,极大地加快迄今费力的人工定量寻找和查看界面的过程。在从电池到半导体的系统中,边缘和界面在决定材料性能方面起着至关重要的作用。

科学家们被迫研究样本中两种或两种以上不同成分相遇的地方,以创造出更坚固、更节能或更持久的材料。现在在美国能源部阿贡国家实验室的一项新研究中,研究人员采用了一项基于机器学习的新技术。

机器学习可以揭开材料中埋藏的界面和边缘的秘密,用来产生使用机器学习进行分析的数据实验技术被称为原子探针断层摄影术,研究人员在这种技术中挑选出针状的三维小样本。然后从样本中剥离单个原子。然后进行飞行时间测量和质谱分析,以确定特定原子在材料中的来源。此过程生成样本中原子位置非常大的数据集,为了分析这个数据集,研究人员将其分割成二维切片。

然后将每个切片表示为一幅图像,机器学习算法可以在该图像上确定边缘和界面。在训练算法识别界面时,由阿贡材料科学家和研究作者奥勒·海诺宁(Olle Heinonen)领导的团队使用了一种非传统方法。海诺宁和同事们没有使用边界可能定义不清的材料库图像,而是从猫和狗的照片开始,以帮助机器学习算法了解图像中的边缘。在训练算法时,这些形状对我们来说很简单。

但对计算机来说却很复杂,所这是提供了一个有用的试验场。然后,研究人员通过汇编一组分子动力学模拟来证明机器学习算法的准确性,用它们来制作合成数据集,在这些数据集中,模拟样本的组成是完全已知的。通过回到机器学习的方法,能够提取成分信息,并将它们与实际情况进行比较。以前,尝试从原子探针断层扫描数据创建这些类型的浓度分布涉及劳动密集型的手动过程。

通过将机器学习算法与新开发的定量分析软件搭配使用,科学家可以极大地加快对各种材料界面的分析速度。该方法是可扩展的,可以把它放在高性能计算上并完全自动化,而不是手动完成并查看不同的浓度,在这里发送代码并按下一个按钮就可以实现。虽然这项技术是为原子探针断层扫描而开发的,但可以适用于任何类型的断层扫描,甚至像X射线断层扫描这样不一定能揭示原子位置的技术。

无论在哪里拥有包含一些结构信息和接口的三维数据集,这项技术都会很有用。催生这项研究合作值得注意的是,包括来自广泛不同领域的专家,包括数学、人工智能、纳米科学、材料科学和计算机科学。研究团队汇集了各种各样的专业知识,以解决材料表征方面的一个具有挑战性的问题。研究作者阿贡计算机科学家普拉桑娜·巴拉普拉卡什说:从机器学习的角度来看,我们必须克服的一个关键挑战是数据匮乏。

在典型的机器学习环境中,训练和学习所需的标记数据是丰富的,但在原子探针断层扫描中,进行每个实验并手动将等浓度表面识别为标记数据需要大量的时间和精力,这阻止了我们直接应用深度学习方法。

研究人员利用转移学习技术,包括使用在自然图像上训练的深度学习模型,自动识别原子探针断层扫描数据中的边缘原子探针断层扫描是在西北大学原子探针断层扫描中心进行的,其研究成果发表在《科学报告》期刊上。