深度进修与化学语言模型连系,用于药物重新设想,登Nature子刊

编辑 | X重新药物设想旨在从零开始生成具有一定化学和药理学特性的份子。近日,苏黎世联邦理工学院的化学家开发了一种新的计算机程序,可以根据蛋白质的三维表面快速、轻松地生成活性药物成分。研讨人员提出了一种使用鉴于相互作用组(interactome)的深度进修的计算办法,用于鉴于配体和布局的类药物份子生成。「这是药物发现的真正突破。」苏黎世联邦理工学院化学与使用生物科学系教授 Gisbert Schneider 说。 这种办法使用了图神经网络和化学语言模型的独特优势,为一定使用的强化、迁移或少样本进修的需求提供了替代方

深度进修与化学语言模型连系,用于药物重新设想,登Nature子刊

编辑 | X

重新药物设想旨在从零开始生成具有一定化学和药理学特性的份子。

近日,苏黎世联邦理工学院的化学家开发了一种新的计算机程序,可以根据蛋白质的三维表面快速、轻松地生成活性药物成分。

研讨人员提出了一种使用鉴于相互作用组(interactome)的深度进修的计算办法,用于鉴于配体和布局的类药物份子生成。

「这是药物发现的真正突破。」苏黎世联邦理工学院化学与使用生物科学系教授 Gisbert Schneider 说。 

这种办法使用了图神经网络和化学语言模型的独特优势,为一定使用的强化、迁移或少样本进修的需求提供了替代方案。

相关研讨以《Prospective de novo drug design with deep interactome learning》为题,于 4 月 22 日 发布在《Nature Communications》上。

深度进修与化学语言模型连系,用于药物重新设想,登Nature子刊

论文链接:https://www.nature.com/articles/s41467-024-47613-w

计算重新设想包括重新开始自主生成具有所需特性的新份子。化学语言模型 (CLM) 是一种机器进修技术,旨在处理和进修表示为序列的份子布局(例如,SMILES)。CLM 已经在新的生物活性份子的重新设想中发现了许多使用。

尽管已经引入了各种鉴于布局的重新设想办法,但它们的潜伏使用尚未得到广泛探索。

最近的科学家集中在研讨份子相互作用网络,称为相互作用组,它涵盖各种类型的相互作用,例如蛋白质-蛋白质、药物-靶标相互作用和药物-药物关系。分析这些相互作用组可以预测以前未知的相互作用,并给出对网络拓扑的深入了解。

深度进修和化学语言模型连系

为了全面研讨药物-靶标相互作用组,苏黎世联邦理工学院研讨人员提出了一种将 CLM 与鉴于相互作用组的深度进修相连系的办法。此深度进修模型被命名为 DRAGONFLY(鉴于药物靶标相互作用的新型生物活性份子的生成)。

对于任何具有已知三维形状的蛋白质,该算法会生成增加或抑制蛋白质活性的潜伏药物份子的蓝图。然后化学家可以在实验室合成和测试这些份子。

该算法所需要的只是蛋白质的三维表面布局。在此基础上,它根据「锁与钥匙」原理设想出与蛋白质特异性连系的份子,这样它们就可以与蛋白质相互作用。

该办法采用了由图变换神经网络(GTNN)和使用长短期记忆(LSTM)的 CLM 组成的神经网络架构。

深度进修与化学语言模型连系,用于药物重新设想,登Nature子刊

图示:DRAGONFLY 架构和工作流程。(来源:论文)

DRAGONFLY 办法采用图神经网络架构。该办法使用 GTNN 模型对输入份子图进行编码,该份子图表示为配体的 2D 图和蛋白质连系位点的 3D 图。GTNN 将图转换为压缩的一维 (1D) 特征向量。随后,使用鉴于 RNN-LSTM 架构的 CLM 进行份子生成过程,将该特征向量解码回相应的份子字符串。

与依赖于单个份子迁移进修的传统 CLM 不同,该办法使用鉴于相互作用组的深度进修,不妨跨多个节点整合来自靶标和配体的信息。DRAGONFLY 不妨处理小份子配体模板以及 3D 蛋白质连系位点信息。它在不同的化学字母表上运行,不需要通过针对一定使用的迁移或强化进修进行微调。

此外,它不妨将所需的物理和化学特性纳入输出份子的生成中。该研讨介绍了 DRAGONFLY 在鉴于布局的重新设想中的前瞻性使用,特别是针对一个或多个一定大份子靶标生成具有所需生物活性特征的配体。

重新药物设想

DRAGONFLY 解决了生成份子设想办法中常见的一些挑战。事实证明,该办法:

与针对药物样配体模板的分别微调的鉴于 RNN 的 CLM 相比,实现了相似甚至更好的结果。使用 3D 蛋白质连系位点实现鉴于布局的设想。有效地将所需的物理和化学性质纳入生成的份子中。它不妨连系鉴于布局和鉴于配体的办法,以及整合所需特性的能力,使其成为药物化学的潜伏有用工具。

DRAGONFLY 不妨「零样本」构建具有一定生物活性、可合成性和布局新颖性的化合物库。

深度进修与化学语言模型连系,用于药物重新设想,登Nature子刊

图示:使用 DRAGONFLY 和定量构效关系(QSAR)模型进行属性转换。(来源:论文)

为了主动评估鉴于蛋白质布局的药物设想的深度相互作用组进修框架,产生了针对人类过氧化物酶体增殖物激活受体(PPAR)γ 亚型连系位点的潜伏新配体。

深度进修与化学语言模型连系,用于药物重新设想,登Nature子刊

图示:使用 DRAGONFLY 进行鉴于布局的重新设想的结果。(来源:论文)

一流的设想是化学合成的,并经过计算、生物物理和生物化学表征。鉴定出有效的 PPAR 部分激动剂,证明其对核受体和脱靶相互作用具有良好的活性和所需的选择性。

深度进修与化学语言模型连系,用于药物重新设想,登Nature子刊

图示:蛋白质-配体共结晶。(来源:论文)

配体-受体复合物的晶体布局测定证实了预期的连系模式。

这一成功成果积极倡导鉴于相互作用组的重新设想在生物有机和药物化学中的使用,从而不妨创建创新的生物活性份子。

鉴于相互作用组的深度进修可作为「零样本」进修的概念验证,可以针对小份子药物发现中的一定使用进一步调整和定制,最终实现在生物有机化学和药物化学中更有效的命中和先导发现。

通过使用数据驱动的深度进修和交互网络,这种办法为基础模型提供了新的途径,从而实现定制的份子设想策略和创新候选药物的发现。

「新算法潜力巨大。我们的研讨使药物研讨中的生成式 AI 可以进入蛋白质世界。」Schneider 说。对于人体内所有不与任何已知化合物相互作用的医学相关蛋白质来说尤其如此。

给TA打赏
共{{data.count}}人
人已打赏
理论

新SOTA,仅几个标志基因即可自动标志,复旦大学开发空间转录组学语义诠释贝叶斯框架

2024-5-6 18:53:00

理论

91.1% 准确率,功能远超 GPT-4 系列模型,谷歌推出多模态医学大模型 Med-Gemini

2024-5-7 18:43:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索