以「钥匙和锁」方式设想份子,浙大&碳硅智慧开发3D份子生成新模型SurfGen

编辑 | 紫罗高效的从头设想是计算机辅助药物发现的巨大挑战。上个月,浙大侯廷军团队和碳硅智慧合作提出了一种鉴于蛋白口袋的三维(3D)份子生成模型——ResGen,ResGen 计算效率更高,比之前最好的技术快大约八倍。研讨成果发表在《Nature Machine Intelligence》上。近日,该团队又在《Nature Computational Science》发表了其最新研讨,提出用于鉴于构造的份子设想新模型——SurfGen。近年来,真实的构造特异性三维份子生成已经开始出现,但大多数办法将宗旨构造视为偏向

以「钥匙和锁」方式设想份子,浙大&碳硅智慧开发3D份子生成新模型SurfGen

编辑 | 紫罗

高效的从头设想是计算机辅助药物发现的巨大挑战。

上个月,浙大侯廷军团队和碳硅智慧合作提出了一种鉴于蛋白口袋的三维(3D)份子生成模型——ResGen,ResGen 计算效率更高,比之前最好的技术快大约八倍。研讨成果发表在《Nature Machine Intelligence》上。

近日,该团队又在《Nature Computational Science》发表了其最新研讨,提出用于鉴于构造的份子设想新模型——SurfGen。

近年来,真实的构造特异性三维份子生成已经开始出现,但大多数办法将宗旨构造视为偏向份子生成的条件输入,并且没有完全了解控制分离复合物份子构象和稳定性的详细原子相互作用。这些细节的遗漏导致许多模型难以为各种治疗靶点输出合理的份子。

为了应对这一挑战,来自浙江大学和碳硅智慧的研讨团队,制定了一个名为 SurfGen 的模型,该模型以类似于「钥匙和锁」原理的方式设想份子。

SurfGen 包含两个等变神经网络,Geodesic-GNN 和 Geoatom-GNN,分别捕获口袋外貌上的拓扑相互作用以及配体原子和外貌节点之间的空间相互作用。

SurfGen 在许多基准测试中都优于其他办法,其对口袋构造的高敏感性使得鉴于生成模型的有效解决方案能够解决渐变诱导的耐药性这一棘手问题。

该研讨以「Learning on topological surface and geometric structure for 3D molecular generation」为题,发布在《Nature Computational Science》上。

以「钥匙和锁」方式设想份子,浙大&碳硅智慧开发3D份子生成新模型SurfGen

药物设想常用办法

合理的药物设想通常通过两种办法进行:鉴于配体的药物设想和鉴于构造的药物设想(SBDD)。人们普遍认为 SBDD 在提供新型候选药物方面更有效,因为它模拟蛋白质如何与小份子相互作用以诱导随后的生物效应。

SBDD 有两种主要方案:虚拟筛选和份子生成。虚拟筛选,评估化合物库中的份子与蛋白质靶标之间的亲和力,并选择排名靠前的份子进行后续实验验证;对于份子生成,通过优化口袋中的原子相互作用,设想化合物与蛋白质的强分离。

对于许多现有的生成模型来说,即使生成过程理论上可以访问化学空间中的更多区域,也往往没有虚拟筛选的实际优势。

研讨蛋白质口袋和小份子之间的相互作用是解决这些挑战的关键。根据一个著名的理论,它们可以被抽象为锁和钥匙模型。

最近,蛋白质-蛋白质相互作用(PPI)预测领域出现了一种新的表征办法,蛋白质被建模为抽象外貌。该办法考虑了蛋白质-蛋白质界面几何形状的兼容性,并且由于蛋白质拓扑的显式建模,能够更直接地捕获复杂的界面-界面相互作用。

SurfGen 鉴于蛋白质口袋外貌生成 3D 份子

受到外貌表征(representation)在 PPI 建模中的启发,研讨人员采用蛋白质外貌通道作为 SBDD 的蛋白质表征,在外貌上嵌入相关的能量特征,然后通过其设想的 Geodesic-图神经网络(Geodesic-Graph Neural Network,Geodesic-GNN)框架进行拓扑进修。

以「钥匙和锁」方式设想份子,浙大&碳硅智慧开发3D份子生成新模型SurfGen

图 1:SurfGen 鉴于蛋白质口袋外貌生成 3D 份子,类似于鉴于锁孔外貌设想钥匙。(来源:论文)

与 PPI 预测的情况不同,蛋白质口袋内小份子的分离相互作用主要由空间相互作用主导,例如范德华力和静电力,因此研讨人员提出了另一个称为 Geoattn-GNN 的框架来进修这种额外的和关键的分离相互作用。新提出的模型 SurfGen 统一了这两个框架,不仅可以进修这种几何相互作用,还可以通过拓扑进修更好地模拟小份子和蛋白质袋之间的互补性。

除了进修有利的分离相互作用模式外,鉴于构造的份子生成还需要指定蛋白质口袋内拟议化合物的原子坐标。为了可靠地做到这一点,通过使物理对称性正确嵌入到网络设想中至关重要。通过使 R ∘ f(x) = f(R ∘ x) (公式 1)或 f(x) = f(R ∘ x) (公式 2)正确地将物理对称性嵌入到网络设想中至关重要。

其中 R 是旋转矩阵,∘ 是矩阵乘法,f(x)是给定输入 x 的神经网络 f 的输出。式 (1) 表示等变性质,式 (2) 表示不变性质。通过分离 SO(3)-等变神经网络和锁与钥匙模型的本质,设想了 Geodesic-GNN 和 GeoattnGNN 模块,用于在 SurfGen 中执行等变性。

研讨人员进行了大量的实验来证明,与原始配体和其他最先进 (SOTA) 办法生成的份子相比,SurfGen 生成的份子不仅对蛋白袋具有更高的分离亲和力,而且与蛋白质口袋形成最佳的几何和能量互补。

以「钥匙和锁」方式设想份子,浙大&碳硅智慧开发3D份子生成新模型SurfGen

图 2:针对 COVID-19 宗旨 3CL 蛋白生成的份子和随机采样的份子。(来源:论文)

此外,实际药物发现案例的结果表明,SurfGen 生成的份子与实验活性份子表现出最高的相似性,并且已经完成了示例性份子生成,以扩展针对 COVID-19 的重点化合物库。

以「钥匙和锁」方式设想份子,浙大&碳硅智慧开发3D份子生成新模型SurfGen

图 3:SurfGen 在真实宗旨上的演示。(来源:论文)

以「钥匙和锁」方式设想份子,浙大&碳硅智慧开发3D份子生成新模型SurfGen

图 4:莽草酸激酶渐变体条件生成份子。(来源:论文)

针对渐变靶标的实验表明,SurfGen 足够灵敏,能够感知蛋白质靶标关键渐变的影响,并且可以观察到渐变引起的对生成份子的显著影响。

局限性及未来展望

总之,SurfGen 是一种 3D 份子生成办法,其灵感源自锁与钥匙的类比。

尽管它在 CrossDock 基准测试和实际数据集上显示出强大的设想能力,但仍然存在某些局限性。

一个值得注意的问题是 SurfGen 仅在 holo 蛋白质构造上进行了评估。在这些构造中,蛋白质口袋已经被诱导进入有利于配体分离的状态。该办法尚未在 apo 构造上进行测试,例如 AlphaFold 预测的构造。为了使 SurfGen 适用于任何给定的蛋白质构造,应考虑使用一个用于探索蛋白质构象空间的附加模块——这是未来研讨的可能途径。

另一个更大的挑战是所生成份子的可合成性。目前的份子生成模型还不够复杂,无法直接产生最佳的候选药物。药物化学家在鉴于 AI 的药物设想中继续发挥着不可替代的作用,通常需要修改生成的份子以提高其可合成性。

展望未来,SurfGen 的宗旨是将可合成性纳入模型的框架中,从而增强其跨多个宗旨指标的智能性。

论文链接:https://www.nature.com/articles/s43588-023-00530-2

给TA打赏
共{{data.count}}人
人已打赏
AI

谷歌2023博士奖学金公布,67位博士生获奖,华人近20位

2023-10-13 14:24:00

AI

当拥有4.9亿用户的神器遇见ChatGPT,视频建造有了超能力

2023-10-13 18:29:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索