优于3D模型,成功率达90.6%,基于扩散的生成式AI从2D分子图摸索过渡态

TSDiff 预测分布的概念说明。(起源:论文)编辑 | X过渡态(TS)摸索对于阐明化学回响反映机制和动力学建模至关重要。最近,机械进修模型在 TS 多少外形(geometries)预测方面表现出了卓越的性能。然而,它们通常需要回响反映物和产品的 3D 构象,并以其适当的方向作为输出,这需要大量的努力和计算成本。近日,韩国科学技术院(KAIST)的研讨职员提出了一种基于随机扩散办法的生成办法,即 TSDiff,用于仅从 2D 分子图预测 TS 多少外形。TSDiff 在准确性和效率方面均优于现有的具有 3D 多少外形的

优于3D模型,成功率达90.6%,基于扩散的生成式AI从2D分子图摸索过渡态

TSDiff 预测分布的概念说明。(起源:论文)

编辑 | X

过渡态(TS)摸索对于阐明化学回响反映机制和动力学建模至关重要。最近,机械进修模型在 TS 多少外形(geometries)预测方面表现出了卓越的性能。然而,它们通常需要回响反映物和产品的 3D 构象,并以其适当的方向作为输出,这需要大量的努力和计算成本。

近日,韩国科学技术院(KAIST)的研讨职员提出了一种基于随机扩散办法的生成办法,即 TSDiff,用于仅从 2D 分子图预测 TS 多少外形。TSDiff 在准确性和效率方面均优于现有的具有 3D 多少外形的 ML 模型。

此外,它能够对各种 TS 构象进行采样,因为它在训练中进修不同回响反映的 TS 多少分布。因此,与参考数据库相比,TSDiff 能在较低的势垒高度找到更有利的回响反映途径。这些结果表明,TSDiff 在高效、可靠的 TS 摸索方面显示出巨大的潜力。

该研讨以「Diffusion-based generative AI for exploring transition states from 2D molecular graphs」为题,于 2024 年 1 月 6 日发布在《Nature Communications》上。

优于3D模型,成功率达90.6%,基于扩散的生成式AI从2D分子图摸索过渡态

论文链接:https://www.nature.com/articles/s41467-023-44629-6

过渡态研讨现状

过渡态是指一种瞬态分子构型,位于回响反映物通过最小能量路径到达产品的能垒之上,对应于势能面(PES)上的鞍点。识别 TS 是化学回响反映分析中的一项重要任务。尽管 TS 多少外形由于其瞬态性质而难以通过实验观察,但可以利用量子化学计算办法获得它们。

在过去的几十年里,开发了各种 TS 优化技术并应用于许多化学回响反映,从而提供了对不同化学现象的见解。

TS 优化办法主要有两大类:单端办法和双端办法,具体取决于输出类型。前者依赖于一组回响反映物的 3D 多少外形或估计的 TS。双端办法利用回响反映物和产品的 3D 多少外形。虽然这些传统办法在实践中被广泛利用,但它们需要大量的计算成本,并且经常出现收敛问题,使得 TS 摸索成为一项相当艰巨的任务。

最近,人们对利用机械进修 (ML) 办法来研讨 TS 越来越感兴趣,目的是降低传统办法的高成本。例如,已经进行了大量研讨来直接估计势垒高度。然而,该研讨重点关注 TS 多少外形的预测。

传统办法和机械进修办法都需要为 3D 分子多少外形进行适当的输出准备。然而,众所周知,传统办法的结果对输出结构很敏感。机械进修办法还采用回响反映物和产品的 3D 构象作为输出。因此,它们不可避免地会遇到相同的输出灵敏度问题。

随机生成模型:TSDiff

为了解决这个问题,KAIST 研讨职员提出了这是一种机械进修模型——TSDiff,可以进修 TS 构象和 2D 分子图之间的直接映射。因此,人们可以跳过构象和方向的正确选择。

此外,TSDiff 可以采用随机扩散办法从 2D 图中生成各种可能的 TS 构象,可靠性高。因此,TSDiff 可以在整个 TS 生成过程中最大限度地减少用户的工作量,并在不直接考虑构象的情况下摸索多种回响反映途径,从而实现高效率。

优于3D模型,成功率达90.6%,基于扩散的生成式AI从2D分子图摸索过渡态

图 1:TSDiff 概述。(起源:论文)

研讨职员利用 Grambow 的数据集评估了 TSDiff 的性能。尽管简化了 2D 图的输出,但与依赖 3D 多少信息的现有办法相比,TSDiff 的准确率最高。

TSDiff 是一个随机生成模型,这意味着每次采样都会生成不同的多少外形。TSDiff 生成的不同多少外形对应于可以从相同的 2D 回响反映图构建的特定 TS 构象。例如,下图显示了与测试集中三个回响反映的特定构象和参考多少外形相对应的几个生成的多少外形。

优于3D模型,成功率达90.6%,基于扩散的生成式AI从2D分子图摸索过渡态

图 2:TSDiff 生成的过渡态 (TS) 构象示例。(起源:论文)

通过基于 DFT 的量子化学计算验证了 TSDiff 生成的多个 TS 构象的有效性。首先,对生成的多少外形进行鞍点优化,得到具有单一虚振动频率的 TS 多少外形。随后进行内禀回响反映坐标 (IRC) 计算,以验证 TS 多少外形是否对应于给定的图定义的回响反映。TSDiff 在此验证中取得了 90.6% 的极高成功率,显示了其作为初始 TS 多少猜测器的可靠性。

优于3D模型,成功率达90.6%,基于扩散的生成式AI从2D分子图摸索过渡态

图 3:TSDiff 生成的多少外形的可视化。(起源:论文)

基于这些结果,研讨职员表示:「我们期望 TSDiff 能够极大地减轻 TS 摸索过程中耗时的试错过程。我们还在鞍点发现了 2303 个新的 TS 构象,而不是利用 TSDiff 对测试集中的 1197 个回响反映进行八轮采样。其中一些对应于比参考文献更低的势垒高度,表明更有利的回响反映途径。」

优于3D模型,成功率达90.6%,基于扩散的生成式AI从2D分子图摸索过渡态

图 4:参考文献的势垒高度与 TSDiff 的势垒高度对比。(起源:论文)

未来潜力

TSDiff 的主要优点之一是它能够在不考虑回响反映物和产品的构象及其排列的情况下找到 TS。由于 TSDiff 不依赖于特定构象,因此它允许利用更通用的办法在图定义的回响反映中有效摸索 TS。

TSDiff 能够有效捕获非回响反映坐标和不同回响反映坐标中可旋转键产生的 TS 构象。此外,TSDiff 也被证明是一个有效的初始 TS 猜测器,在后续 TS 优化过程中只需要少量的强制调用。总的来说,该研讨结果证明了 TSDiff 作为高效可靠的 TS 摸索的有前途的办法的潜力。

这些发现表明,随机扩散办法可以在平衡状态下准确地创建多种构象异构体,可扩展到 TS 摸索。

然而,研讨也有局限性,特别是它目前对有机回响反映的限制。尽管存在有机数据库,但缺乏大型有机回响反映数据库限制了机械进修办法在该领域的适用性。

随着未来数据的不断积累,研讨职员表示 TSDiff 的用途将扩大到涵盖更广泛的化学回响反映,包括涉及有机物质的化学回响反映。

给TA打赏
共{{data.count}}人
人已打赏
理论

微软和 PNNL 合作研讨,AI 发明的新资料可以增加电池中锂的利用

2024-1-11 17:26:00

理论

如何高效摆设大模型?CMU最新万字综述纵览LLM推理MLSys优化技术

2024-1-15 10:55:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索