编辑 | 紫罗
药理学领域的化学空间高达 10^60,在广阔的化学空间中进行搜索,给药物安排带来了巨大的挑战。
鉴于片断的药物发现一直是早期药物开发的有用范例。然而,该领域面临的一个挑战是,如何安排断开的感兴趣份子片断之间的接连子(linker),生成化学上合理的候选药物份子。
在此,来自微软钻研院科学智能中心(AI4Science)、洛桑联邦理工学院、牛津大学和 MIT 的钻研团队,提出了一种用于份子 linker 安排的 E(3) 等变三维前提散布模型 DiffLinker。
与以前只能接连份子片断对的格式不同,新格式可以接连任意数量的片断。此外,模型会自动确定 linker 中的原子数量及其与输出片断的接连点。
DiffLinker 在标准数据集上优于其他格式,可生成更多样化且可合成的份子。在实际应用中对其格式进行实验测试,表明它可以成功生成以靶标卵白口袋为前提的有用 linker。
钻研职员表示,术语「linker」泛指任何能够接连起始份子片断的化学物质,并不特指与所讨论任一领域相干术语的特定含义。
相干钻研以《Equivariant 3D-conditional diffusion model for molecular linker design》为题,于 2024 年 4 月 11 日发布在《Nature Machine Intelligence》上。
论文链接:https://www.nature.com/articles/s42256-024-00815-9
据估计,药理学相干份子的空间超过 10^60 个结构。减小该空间大小的一个成功格式是从「片断」开始,这些小份子化合物通常不超过 20 个重(非氢)原子。这种策略称为鉴于片断的药物安排 (FBDD)。
给定卵白质口袋,通过计算确定与口袋相互作用的片断是比实验筛选格式更便宜、更有用的替代格式。一旦相干片断被识别并与靶标卵白对接,就需要将它们组合成单个接连的化合物。
机器学习格式格式可以超越可用数据并更有用地生成不同的 linkers。然而,这些格式在原子排列方面并不等变,并且只能组合片断对。迄今为止,还没有考虑靶标卵白口袋的份子 linker 安排计算格式。
最先进的生成格式:前提散布模型 DiffLinker
在此,钻研职员解决了放置在三维 (3D) 环境中的片断接连起来的问题,并可以将安排过程调节到靶标卵白口袋。
DiffLinker 是一种前提散布模型,可以为一组表示为 3D 原子点云的输出片断生成份子 linker。
首先,模型生成预期 linker 的大小,然后从正态分布中采样初始 linker 原子类型和位置。接下来,使用以输出片断为前提的神经网络迭代更新接连原子类型和坐标。最终,去噪后的接连原子和输出片断原子形成一个 linker 的份子。
图 1:份子 linker 生成过程概述。(来历:论文)
DiffLinker 有几个理想的属性:它与平移、旋转、反射和排列等价;它不受输出片断数量的限制,不需要有关接连原子的信息,并且生成没有预定义大小的 linker。
此外,钻研职员提出了一种新的欧几里得散布模型的 3D 调节机制,这使得 DiffLinker 成为一种多功能且最先进的生成格式,适用于各种鉴于结构的药物安排任务。
表 1:ZINC、CASF 和 GEOM 测试集的性能指标。(来历:论文)
钻研表明,DiffLinker 在生成片断对之间的化学相干 linker 方面的性能优于以前的格式。
该格式在合成可及性和药物相似性方面取得了最先进的结果,这使得它在药物安排管道中非常有用。
此外,DiffLinker 在生成的 linker 的化学多样性方面明显优于其他格式。
图 2:在口袋前提和非前提前提下使用 DiffLinker 生成配体。(来历:论文)
钻研职员进一步提出了一个更具挑战性的基准,并表明该格式能够成功 link 两个以上的片断,这是其他格式无法做到的。
钻研还证明了 DiffLinker 可以以靶标卵白口袋为前提;模型尊重周围卵白质原子施加的几何约束,并生成在结构上与相应口袋兼容的份子。
三个案例钻研
为了证明 DiffLinker 在实际药物安排应用中的相干性,钻研职员提供了三个案例钻研:热休克卵白 90 (Hsp90) 和肌苷 5'-单磷酸脱氢酶 (IMPDH) 抑制剂的鉴于片断的安排,以及用于提高 c-Jun 氨基末端激酶 (JNK) 选择性的支架跳跃(scaffold hopping)。
Hsp90 是一种份子 chaperone,参与多种卵白质的折叠,包括那些参与致癌转化的卵白质。DiffLinker 成功复现了参考文献中报告的抑制剂。重现参考抑制剂份子的所有三个 DiffLinker 样品的对接分数与参考分数相当。
图 3:Hsp90 作为鉴于片断的配体生成的实际示例。(来历:论文)
IMPDH 是一个有吸引力的结核病药物靶点,在鸟嘌呤核苷酸的从头合成中发挥着重要作用。DiffLinker 复现文献报道的两个最有用的抑制剂:化合物 30 和化合物 31。尽管 DiffLinker 没有重现化合物 29,但它生成了 Tanimoto 距离相似的份子。
图 4:鉴于片断的 IMPDH 抑制剂安排案例钻研。(来历:论文)
JNK 是丝裂原激活卵白激酶的一个重要卵白家族,可调节多种细胞过程,包括细胞增殖、凋亡、自噬和炎症。钻研了 DiffLinker 生成一组不同支架的能力。
DiffLinker 复现了吲唑和氨基吡唑支架。此外,还确定了生成的支架的 238 个独特拓扑,这表明 DiffLinker 能够通过 linker 区域的采样来广泛探索潜在相干支架的空间。
图 5:探索化学多样性以提高 JNK 抑制剂的选择性。(来历:论文)
钻研职员表示,「DiffLinker 是第一个不受输出片断数量限制并考虑口袋信息的格式。我们的总体目标是,为从业者提供在真实药物安排中生成份子 linker 的有用工具。」