中国科大团队开发用于原子系统对外部场响应的通用机器学习模型

2023-10-21 11:24

编辑 | 萝卜皮机器学习的原子间相互作用势使得封闭系统的高效、准确的分子模拟成为可能。然而，可以极大地改变化学结构或反应性的外部场，很少被包含在当前的机器学习模型中。中国科学技术大学的研究人员提出了一种通用场诱导递归嵌入原子神经网络（field-induced recursively embedded atom neural network，FIREANN）模型，该模型将伪场矢量依赖特征整合到原子描述符中，以表示具有严格旋转等变性的系统-场相互作用。这种「一体式」方法将偶极矩和极化率等各种响应特性与单个模型中的场相

编辑 | 萝卜皮

机器学习的原子间相互作用势使得封闭系统的高效、准确的分子模拟成为可能。然而，可以极大地改变化学结构或反应性的外部场，很少被包含在当前的机器学习模型中。

中国科学技术大学的研究人员提出了一种通用场诱导递归嵌入原子神经网络（field-induced recursively embedded atom neural network，FIREANN）模型，该模型将伪场矢量依赖特征整合到原子描述符中，以表示具有严格旋转等变性的系统-场相互作用。

这种「一体式」方法将偶极矩和极化率等各种响应特性与单个模型中的场相关势能相关联，非常适合在存在电场的情况下对分子和周期系统进行光谱和动力学模拟。特别是对于周期系统，FIREANN 可以通过仅训练原子力来克服极化的内在多值问题。

该研究以「Universal machine learning for the response of atomistic systems to external fields」为题，于 2023 年 10 月 12 日发布在《Nature Communications》。

中国科大团队开发用于原子系统对外部场响应的通用机器学习模型

外部场和化学系统之间的相互作用在一系列物理、化学和生物过程中至关重要。通过与原子、分子或凝聚态物质相互作用，外部（主要是电场）可以引起系统的电子/自旋极化和空间取向；它提供了改变化学结构、促进电子转移、控制材料的相变或生物分子的构象转变、巧妙地操纵催化中的化学反应性和选择性以及冷化学反应中的量子动力学的特殊方法。

精确的场相关量子散射计算仅适用于非常小的系统。基于现代极化理论的密度泛函理论（DFT）和从头算分子动力学（AIMD）模拟已更普遍地应用于研究存在外部电场的更复杂的非周期和周期系统。然而，AIMD 方法的要求仍然非常高，尤其是当核量子效应（NQE）很重要时。

尽管经验力场可以非常高效，但其准确性受到经验函数和相互作用哈密顿量的近似表达式的限制。例如，常用的偶极子场近似将电场对系统的扰动截断为一阶（即仅包括与永久偶极子的相互作用），并忽略与极化性、超极化性等等。此外，除了这些反作用力场之外，大多数都无法描述键的断裂/形成。

近年来，机器学习（ML）方法在解决化学高维问题方面取得了革命性的成功。人们已经开发出各种用于准确表示势能面（PES）的机器学习模型。其中一些已扩展到学习张量特性，例如具有正确旋转等变性的偶极矩和极化张量，从而实现电子和振动光谱的高效无场模拟。然而，大多数机器学习模型分别处理势能及其对电场的响应特性，而没有捕获场依赖性。

在最新的研究中，通过在原子环境的描述中引入简单的场相关特征，中国科学技术大学的研究人员开发了一种场诱导递归嵌入原子神经网络（FIREANN）模型，该模型具有与外部场相互作用的系统的正确旋转等变性。

在不截断场引起的相互作用的情况下，FIREANN 不仅描述了能量随施加场强和方向的变化，而且还同时描述了（原则上）任何阶数的相关响应属性。基于路径积分的分子动力学 (MD) 模拟与训练有素的 FIREANN 模型可在存在电场的情况下产生代表性分子和凝聚相系统的可靠的从头算光谱。

该模型的一个显著特征是，它可以通过仅学习原子力来绕开周期系统中极化的多值问题，这是现有机器学习模型中众所周知但很大程度上被忽视的事实。

中国科大团队开发用于原子系统对外部场响应的通用机器学习模型

图示：FIREANN框架示意图。（来源：论文）

该模型使研究人员能够从一次训练中获得所有成分，以对有或没有外部电场的化学系统的光谱和动力学进行建模。NMA分子和液态水的预测振动光谱与无场实验数据之间的良好一致性支持了该模型的有效性。此外，在现场红外或拉曼光谱中可以清楚地预测场诱导的偶极矩排列和共价键的软化。

特别是对于像液态水这样的周期性系统，系统固有的多值极化导致训练数据中偶极矩不连续，很难用基于原子电荷的传统机器学习模型来表示。在 FIREANN 模型中，通过仅学习原子力，可以很好地绕过这个问题，原子力可以产生场相关势和偶极矩，从而产生液态水的红外光谱。该团队的结果不仅清楚地验证了一体化 FIREANN 模型的高精度，而且还阐明了化学系统和电场之间的相互作用。

中国科大团队开发用于原子系统对外部场响应的通用机器学习模型

图示：液态水的无场和场内红外光谱。（来源：论文）

在当前基于原始 PyTorch 框架的实现中，在最完整的场景中训练 FIREANN 模型将比仅强制训练花费 4 倍的时间，因为前一个过程需要样本到样本（高阶）梯度。这个问题可以通过基于新版本 PyTorch 中最近发布的 functorch 模块的改进实现来很大程度上缓解，该模块允许高效计算样本到样本（高阶）梯度。

需要注意的是，当前版本的 FIREANN 模型仅限于描述均匀外场的影响。在非均匀外场的情况下，电子密度对场的响应是空间相关的，必须明确考虑。

一种可行的方法是将非均匀场离散化到每个原子中心，并向每个FI-EAD特征引入非等价的场相关函数，以近似每个原子密度对中心原子所经历的局部场的响应。该调整旨在引入与整个系统相互作用的外部非均匀场。这与大约由溶剂环境产生的不均匀电场不同，后者仅作用于嵌入分子中心。

这些理想的特征使得 FIREANN 方法非常有希望有效地模拟强场诱发的现象，例如电化学、等离子体化学和尖端诱发的催化反应。

论文链接：https://www.nature.com/articles/s41467-023-42148-y

风清、风雷、风顺，中国气象局发布三个 AI 气象大模型系统

感谢中国气象局昨日（6 月 18 日）发布公告，宣布推出“风清”、“风雷”、“风顺”三种 AI 气象大模型系统。全球中短期预报系统“风清”该模型具有大气强物理融入和可解释性，在实现高效计算的同时，可为预测结果提供物理可解释性依据，自动挖掘包括天气系统内在的物理演变。IT之家援引检验结果，该模型全球可用预报天数达到 10.5 天，超过欧美主流气象预报大模型，尤其是在较长预报时效，具有更为明显的优势。人工智能临近预报系统“风雷”该模型将数据驱动与物理驱动两大科学范式紧密结合，显著提高了公里尺度下 0 至 3 小时雷达回

6/19/2024 7:15:12 AM

故渊

Anthropic 公开 Claude AI 模型的系统提示词

科技媒体 Techcrunch 昨日（8 月 26 日）报道，Anthropic 公司公开了 Claude AI 模型的“系统提示词”（system prompts）。系统提示词（System prompt）为了让 AI 模型更好地理解人类指令，提示词（Prompt）工程实际上包含 2 层核心内容，用户提示词（User prompt）和系统提示词（System prompt）：用户提示词：用户输入的提示词，然后 AI 模型基于用户提示词生成答案。系统提示词：这是由系统生成的提示，通常用于设定对话的背景、提供指导或规

8/27/2024 7:22:55 AM

故渊