更低估计成本,基于单电子约化密度矩阵的机械进修电子布局方式

编辑 | 萝卜皮密度泛函理论(DFT)的定理建立了多体零碎的局部外部势与其电子密度、波函数以及单粒子约化密度矩阵之间的双射映射。在此基础上,罗格斯大学(Rutgers University)和纽约大学(New York University)的研究人员证明基于单电子约化密度矩阵(reduced density matrices)的机械进修模型可用于生成替换电子布局方式。该团队为从小份子(如水)到更复杂的化合物(如苯和丙醇)的零碎生成局部和混合 DFT、Hartree-Fock 和完整构型相互作用理论的替换品。代理模

更低估计成本,基于单电子约化密度矩阵的机械进修电子布局方式

编辑 | 萝卜皮

密度泛函理论(DFT)的定理建立了多体零碎的局部外部势与其电子密度、波函数以及单粒子约化密度矩阵之间的双射映射。

在此基础上,罗格斯大学(Rutgers University)和纽约大学(New York University)的研究人员证明基于单电子约化密度矩阵(reduced density matrices)的机械进修模型可用于生成替换电子布局方式。

该团队为从小份子(如水)到更复杂的化合物(如苯和丙醇)的零碎生成局部和混合 DFT、Hartree-Fock 和完整构型相互作用理论的替换品。代理模型使用单电子约化密度矩阵作为要进修的中心量。根据展望的密度矩阵,研究人员表明标准量子化学或第二个机械进修模型可用于估计份子可观测值、能量和原子力。

代理模型基本上可以生成标准电子布局方式可以生成的任何内容,从带隙和 Kohn-Sham 路线到节能的从头算份子动力学模拟和红外光谱;它解释了非谐性和热效应,而不需要采用估计成本高昂的算法。

该研究以「Machine learning electronic structure methods based on the one-electron reduced density matrix」为题,于 2023 年 10 月 7 日发布在《Nature Communications》。

更低估计成本,基于单电子约化密度矩阵的机械进修电子布局方式

通常使用估计模型来展望份子和材料特性,从而代替或在进行昂贵的实验之前进行展望。它们还用于解释实验观察背后的复杂电子和核动力学。当这些估计策略需要评估零碎的电子布局时,它们往往成为估计瓶颈,延长求解时间。因此,一个重要且及时的方针是开发能够以降低的估计成本,甚至完全绕过电子布局估计来提供复杂零碎的电子布局的方式。

机械进修方式的标准用途是针对单个展望的数量,这些数量是通过一些描述符来进修的。例如,电子能量的展望(包括应用「δ」进修概念的展望)、偶极矩和极化率等。这样的作案方式并不理想。如果方针是模型尚未训练过的量,则需要训练新模型来展望该量。一个相关的例子是红外 (IR) 光谱的估计,其中需要谱线位置和强度。进修份子零碎或材料势能面的典型机械进修模型只能通过份子动力学模拟和速度自相关函数分析来展望谱线位置。然而,为了展望强度,需要偶极矩的自相关函数。

建立两个机械进修模型(一个用于能量表面,一个用于偶极矩)的通常过程非常耗时,但最终是可以避免的。值得注意的是,有各种正在开发和补充的技术,涉及使用对称 2 或 N 中心表示或深度神经网络表示来进修关于局域路线的哈密顿矩阵。

理想的机械进修方式应该从其所包含的信息量密集的数量中进行进修。最通用、最理想的机械进修模型将进修多体电子波函数。根据波函数,研究人员可以展望势能面、偶极矩和任何其他感兴趣的量。多体波函数的 ML 模型与其他精确波函数求解器(例如量子蒙特卡罗)相比正在变得具有竞争力。

然而,估计和训练数据大小的复杂性阻碍了它们的广泛适用性。幸运的是,可以利用 DFT 和降密度矩阵泛函理论(RDMFT)的严格双射图将焦点从多体波函数转移到其他相关量。当考虑自旋零碎时,1-rdm(the 1-electron reduced density matrix) 的 ML 模型需要额外的约束和功能。

电子密度可以根据局部原子中心描述符来进修。虽然使用这些方式获得的能量可以精确到 1 kcal ⋅ mol^−1 左右,但模型密度通常与方针存在百分之几的偏差。然而,即使有这些小偏差,模型密度也不能直接用于评估 DFT 算法中的离子力。这是因为自洽的电子密度必须收敛到更严格的阈值内,以进行精确的力估计。利用 Hohenberg 和 Kohn 定理,电子密度可以用作 ML 模型中的方针量,其中外部电势作为特征。这可以恢复模型电子密度,即使不完全准确,仍然可以成功地用作准确进修 DFT 和耦合簇等方式的能量和力的特征。

更低估计成本,基于单电子约化密度矩阵的机械进修电子布局方式

图示:替换电子布局方式的准确性作为苯份子训练集大小的函数。(来源:论文)

即使非局部相关性很重要,1-rdm 也正在成为描述量子零碎的强大特征。在最新的研究中,罗格斯大学和纽约大学的研究人员接受了进修 1-rdm 的挑战,其准确度使得展望的 1-rdm 与标准电子布局软件提供的 1-rdm 基本上没有区别。

该团队通过在高斯型路线 (GTO) 上表示外部势和方针 1-rdms 来实现这一方针,并设计一个高效的训练集生成器。这使他们能够提供「替换电子布局方式」,展望 1-rdms,然后提供有用的量(例如能量、力、带隙、路线),这些量与标准电子布局软件估计的量一样准确和有用。

该团队展示了水和苯等刚性份子以及 1- 和 2-丙醇等柔性份子的 DFT、HF 和后 HF 替换物。首先,他们的模型进修了这些零碎的 1-rdm 作为外部势的函数。然后,从 DFT 和 RDMFT 机械进修严格的映射,从而展望 1-rdm 到能量和 1-rdm 到原子力映射。

更低估计成本,基于单电子约化密度矩阵的机械进修电子布局方式

图示:水替换电子布局方式的性能。(来源:论文)

该团队的替换方式可以稳健地展望几何优化、从头算动力学和份子偶极矩的红外光谱。由于其多功能性,替换方式不仅可以展望布局和动力学,还可以展望单电子算子和 Kohn-Sham 路线的期望值。他们展望了几个份子的 HOMO 和 LUMO 路线以及能隙,即使对于远离训练集采样的构型空间的几何形状,结果也非常接近传统方式。

更低估计成本,基于单电子约化密度矩阵的机械进修电子布局方式

图示:用替换电子布局方式展望气相红外光谱。(来源:论文)

这项研究是一个概念证明,表明替换电子布局方式可以取代传统电子布局方式来完成大多数估计化学任务。然而,将该算法扩展到高阶 rdms 将能够估计双电子算子、能量和力的期望值,并将在未来考虑。凝聚相零碎和更大的份子也是未来发展的方针。为了接近大份子,可以结合从小份子学到的单独份子片段的 1-rdms 来构建 1-rdms 的初始猜测。然后可以单独进修它们的耦合。

这项工作中开发的方式收集在全 Python QMLearn 软件中,该软件可以从 GitLab 免费获得,并可以通过 pip install qmlearn 轻松安装。

QMLearn 由以下类组成:(1)收集训练集的数据库;(2) QM 引擎(该团队使用 PySCF,尽管也支持其他引擎)能够在 GTO 上生成训练集和矩阵元素以及估计能量和原子力所需的基础设施;(3) 布局处理程序(该团队使用原子模拟环境)。ASE 用于处理份子几何形状,包括驱动份子动力学模拟;(4) ML 模块,例如 scikit-learn 或 Tensorflow(当前版本的 QMLearn 仅支持 scikit-learn)。

论文链接:https://www.nature.com/articles/s41467-023-41953-9

给TA打赏
共{{data.count}}人
人已打赏
应用

研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(中)

2023-10-28 8:40:46

应用

如何用Stable Diffusion 把黑白老照片变成彩色高清图?教程来了!

2023-10-30 0:01:12

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索