图神经网络准确预测无机化合物性质,加速固态电池的设计

编辑/绿萝大规模从头计算与结构预测的进步相结合,在无机功能材料的发现中发挥了重要作用。目前,在无机材料的广阔化学空间中,只发现了一小部分。实验和计算研究人员都需要加速探索未知的化学空间。来自美国国家可再生能源实验室(NREL)、科罗拉多矿业学院和伊利诺伊大学的研究人员展示了一种可以准确预测无机化合物性质的机器学习方法。展示了基态(GS)和更高能量结构的平衡训练数据集,对使用通用图神经网络(GNN)架构准确预测总能量的重要性。该研究可加速固态电池的设计。该研究以「Predicting energy and stabi

编辑/绿萝

大规模从头计算与结构预测的进步相结合,在无机功能材料的发现中发挥了重要作用。目前,在无机材料的广阔化学空间中,只发现了一小部分。实验和计算研究人员都需要加速探索未知的化学空间。

来自美国国家可再生能源实验室(NREL)、科罗拉多矿业学院和伊利诺伊大学的研究人员展示了一种可以准确预测无机化合物性质的机器学习方法。展示了基态(GS)和更高能量结构的平衡训练数据集,对使用通用图神经网络(GNN)架构准确预测总能量的重要性。该研究可加速固态电池的设计。

该研究以「Predicting energy and stability of known and hypothetical crystals using graph neural network」为题,发表在《Patterns》杂志上。

图神经网络准确预测无机化合物性质,加速固态电池的设计

晶体内部结构中的原子有规则地在三维空间呈周期性重复排列。测量这些晶体结构稳定性的一种方法是计算它们的总能量——较低的总能量转化为较高的稳定性。单一化合物可以具有许多不同的晶体结构。为了找到能量最低的结构:基态结构。研究人员依赖于计算成本高昂的高保真数值模拟。

如果在电极和电解质之间的界面形成竞争相,固态电池会失去容量和电压。寻找相容的材料,确保材料不会分解。但候选的领域很广:估计表明有数百万甚至数十亿种似是而非的固态化合物等待被发现。

「你无法对这个潜在晶体结构空间的大片区域进行这些非常详细的模拟。」NREL 研究员 Peter St. John说。「每个都是非常密集的计算,在大型计算机上需要几分钟到几小时。」 然后,人类必须梳理所得数据,以手动识别新的预期材料。

为了加速这一过程,研究人员使用了一种称为图神经网络的机器学习形式。图神经网络是一种经过训练可以检测和突出显示数据模式的算法。在这里,「图」本质上是每个晶体结构的图。该算法分析每个晶体结构,然后预测其总能量。

对于基准测试,研究人员在来自 NREL 材料数据库 (NRELMatDB) 的 ICSD(无机晶体结构数据库) 结构的 DFT 总能量上训练 CGCNN 模型。该模型在 15,500 个晶体结构上进行了训练,每个结构都保留了 其中 500 个用于验证和测试。

图神经网络准确预测无机化合物性质,加速固态电池的设计

GNN 模型架构。

然而,任何神经网络的成功都取决于其用来学习的数据。科学家们已经确定了超过 200,000 种无机晶体结构,但还有很多的可能性。一些晶体结构起初看起来很稳定——直到与较低能量的化合物进行比较才会发现并非如此。研究人员提出了假设的、更高能量的晶体,可以帮助机器学习模型提高分辨看似稳定的结构和实际稳定结构的能力。

「要训练一个能够正确预测结构是否稳定的模型,你不能只给它提供我们已经知道的基态结构。你必须给它这些假设的高能结构,这样模型才能区分这两者,」St. John说。

为了训练他们的图神经网络,研究人员创建了基于量子力学计算而不是自然的理论示例。通过在训练数据中同时包含基态和高能晶体,与仅在基态结构上训练的模型相比,研究人员能够获得更准确的结果。研究人员模型的平均误差比对比案例低五倍。

具体而言,研究人员使用 Kendall 等级相关系数 (KRCC) 作为度量来比较不同模型和数据集之间预测能量等级的准确性。

当在相同的组合数据集上训练时,GNN 模型、MEGNet 和 CGCNN 模型具有相似的平均 KRCC。与仅在 ICSD 结构上训练相同模型相比,这是 KRCC 的显着改进。因此,训练数据的选择起着更关键的作用,而实际模型架构对模型在结构能量排名中的性能影响较小。

图神经网络准确预测无机化合物性质,加速固态电池的设计

不同数据集和模型的能源排名比较。

这种方法可以彻底改变研究人员发现具有宝贵特性的新材料的速度,使他们能够快速地发现最有前途的晶体结构。科罗拉多矿业学院的研究教授 Gorai 说,这项工作具有广泛的相关性。

「两种固体相互接触的情况发生在许多不同的应用中——光伏、热电、各种功能设备。」Gorai 说。「一旦该模型成功,它就可以部署在固态电池之外的许多应用中。」

论文链接:https://doi.org/10.1016/j.patter.2021.100361

参考内容:https://techxplore.com/news/2021-12-machine-method-battery-materials.html

相关资讯

数百万晶体数据训练,解决晶体学相位问题,深度学习方法PhAI登Science

编辑 | KX时至今日,晶体学所测定的结构细节和精度,从简单的金属到大型膜蛋白,是任何其他方法都无法比拟的。然而,最大的挑战——所谓的相位问题,仍然是从实验确定的振幅中检索相位信息。丹麦哥本哈根大学研究人员,开发了一种解决晶体相问题的深度学习方法 PhAI,利用数百万人工晶体结构及其相应的合成衍射数据训练的深度学习神经网络,可以生成准确的电子密度图。研究表明,这种基于深度学习的从头算结构解决方案方法,可以以仅 2 埃的分辨率解决相位问题,该分辨率仅相当于原子分辨率可用数据的 10% 到 20%,而传统的从头算方法通

顶尖AI研究者,中国贡献26%:全球人才智库报告出炉

建设大学 AI 专业,大力投入产业发展,现在成效已逐渐显现。2019 年,《麻省理工科技评论》报道了一份关于中国人工智能人才库增长速度的报告。报告的主要发现非常有趣:在过去十年中,来自中国的人工智能精英学者数量翻了 10 倍,但留在中国工作的人相对较少。本周,这份报告背后的智库发布了一份最新分析报告,显示了全球人工智能人才的构成自此之后发生了怎样的变化——在这个关键时期,人工智能产业发生了重大转变,成为最热门的技术领域。人工智能 (AI) 已经席卷了世界。大型语言模型和机器学习方法的突破,以及算力硬件的惊人改进,让

光芯片能否代替电子芯片?破解 AI 「算力荒」

编辑 | ScienceAI摩尔定律的描述已经非常快了——计算机芯片每两年左右就会安装两倍数量的晶体管,从而在速度和效率上产生重大飞跃。但深度学习时代的计算需求增长速度更快——这种速度可能不可持续。论文链接:,2026 年人工智能消耗的电力将是 2023 年的 10 倍,而当年的数据中心消耗的能源将相当于日本一个国家一年的能源消耗。报告链接:「人工智能所需的[计算能力]每三个月就会翻一番,速度远远快于摩尔定律的预测。」 计算硬件公司 Lightmatter 的创始人兼首席执行官 Nick Harris 表示,「这会