新SOTA,浙大、中科院深度学习模型可靠、准确预测蛋白-配体,助力药物开发

编辑 | 萝卜皮准确预测蛋白质-配体相互作用对于理解细胞过程至关重要,目前仍面临着诸多挑战。 中国科学院、浙江大学的研究人员提出了 SurfDock,这是一种深度学习方法,通过将蛋白质序列、三维结构图和表面级特征整合到等变架构中来解决这一挑战。 SurfDock 在非欧几里德流形上采用生成扩散模型,优化分子平移、旋转和扭转以生成可靠的结合姿势。

新SOTA,浙大、中科院深度学习模型可靠、准确预测蛋白-配体,助力药物开发

编辑 | 萝卜皮

准确预测蛋白质-配体相互作用对于理解细胞过程至关重要,目前仍面临着诸多挑战。

中国科学院、浙江大学的研究人员提出了 SurfDock,这是一种深度学习方法,通过将蛋白质序列、三维结构图和表面级特征整合到等变架构中来解决这一挑战。

SurfDock 在非欧几里德流形上采用生成扩散模型,优化分子平移、旋转和扭转以生成可靠的结合姿势。

在各种基准评估中,SurfDock 在对接成功率和遵守物理约束方面均优于现有方法。它还表现出对未见蛋白质和预测的载脂蛋白结构的显著通用性,同时在虚拟筛选任务中实现了最先进的性能。

在实际应用中,SurfDock 在针对细胞代谢中的关键酶醛脱氢酶 1B1 的虚拟筛选项目中确定了七种新的命中分子。

SurfDock 具有阐明细胞过程背后的分子机制的能力,可以为理解蛋白质-配体相互作用提供更高的准确性、物理合理性和实际适用性。

该研究以「SurfDock is a surface-informed diffusion generative model for reliable and accurate protein–ligand complex prediction」为题,于 2024 年 11 月 27 日发布在《Nature Methods》。

新SOTA,浙大、中科院深度学习模型可靠、准确预测蛋白-配体,助力药物开发

了解蛋白质-配体相互作用是分子生物学和生物化学的基础。这些相互作用是许多细胞过程的核心,从酶催化到信号转导。它们在维持细胞稳态、调节基因表达和协调复杂的生物途径方面发挥着至关重要的作用。

通过阐明这些相互作用,科学家可以深入了解疾病的机制、细胞功能和进化过程。蛋白质-配体相互作用的基础知识为基于结构的药物设计 (SBDD) 铺平了道路。

SBDD 利用研究者对这些相互作用的理解来发现或设计与特定蛋白质结合的配体,从而调节其功能从而达到治疗目的。药物的有效性在很大程度上取决于它与目标蛋白质的结合程度以及它是否会影响体内的其他蛋白质。

分子对接方法是应对蛋白质-配体相互作用的一种重要方法,但是目前传统和基于深度学习的配体对接方法都面临对接精度或姿势合理性的限制。

新方法 SurfDock

在最新的研究中,为了解决这些限制,中国科学院、浙江大学的研究团队提出了 SurfDock,这是一种几何扩散网络,旨在生成可靠且准确的结合配体姿势。

新SOTA,浙大、中科院深度学习模型可靠、准确预测蛋白-配体,助力药物开发

图示:SurfDock 的整体架构。(来源:论文)

SurfDock 的扩散过程取决于蛋白质口袋和随机起始配体构象。它还包括一个内部评分模块 SurfScore,该模块在晶体蛋白质-配体复合物上进行训练,用来评估姿势的置信度。

SurfDock 将多模态蛋白质信息(如表面特征、残基结构特征和预训练的序列级特征)整合到表面节点级表示中。因此,它在多个基准测试中的对接成功率均达到最高水平。这些基准测试包括 PDBbind2020、Astex Diverse Set、PoseBusters 基准测试集和 DockGen 数据集。

新SOTA,浙大、中科院深度学习模型可靠、准确预测蛋白-配体,助力药物开发

图示:PDBbind2020 数据集对接性能的比较分析。(来源:论文)

在生成的姿势的合理性方面,SurfDock 明显优于以前的 DL 方法。SurfDock 还结合了可选的基于力场的简单松弛步骤,用于蛋白质固定配体优化,从而进一步提高了其准确性和有效性。

此外,SurfDock 可有效推广到新的蛋白质或口袋,并且对不同的配体灵活性具有很强的适应性。研究人员在虚拟筛选基准数据集 DEKOIS 2.0 上对 SurfDock 进行了概念验证评估。结果显示,SurfDock 不仅与现有对接方法的性能相当,而且超过了它们的性能。

新SOTA,浙大、中科院深度学习模型可靠、准确预测蛋白-配体,助力药物开发

图示:不同对接方法在 DEKOIS 2.0 数据集上的表现。(来源:论文)

考虑到近年来蛋白质结构预测技术的进步,该团队还测试了 SurfDock 在计算预测的 apo 结构上的性能。借助表面表示带来的隐式灵活性,SurfDock 在 apo 结构上也取得了显著的性能。

新SOTA,浙大、中科院深度学习模型可靠、准确预测蛋白-配体,助力药物开发

图示:SurfDock 为 ALDH1B1 确定了新的支架。(来源:论文)

研究中,该团队还展示了 SurfDock 在现实世界小分子发现项目中的实际用途,该项目针对目标醛脱氢酶 1B1 (ALDH1B1),其中快速识别出具有新骨架的七个命中分子。

局限性

虽然经验结果表明 SurfDock 具有有效的对接能力,但它也存在一些局限性。例如,如果蛋白质在配体结合后发生显著的构象变化,SurfDock 可能无法准确预测蛋白质-配体复合物,因为它没有明确适应蛋白质的灵活性。

此外,SurfDock 包括一个可选步骤,用于基于力场的对接后能量最小化,这表明姿势准确性和有效性有提高的潜力。

结语

尽管如此,SurfDock 所表现出的可靠性、稳健性、物理合理性和实际适用性,表明它确实有成为结构生物学变革工具的潜力。

准确预测蛋白质-配体复合物的能力可以大大提高科学家对蛋白质生物学的理解,并有助于设计新的治疗剂。

鉴于计算能力的进步和对各种化学空间的可访问性的提高,研究人员设想 SurfDock 将成为 SBDD 社区中必不可少的工具,并通过他们的持续改进为对基础生物学或药物发现具有重要意义的新靶标的化学验证铺平道路。

论文链接:https://www.nature.com/articles/s41592-024-02516-y

相关报道:https://phys.org/news/2024-12-ai-enables-reliable-accurate-protein.html

给TA打赏
共{{data.count}}人
人已打赏
理论

Science子刊,理解更真实的溶液,ML力场将速度提升六个数量级,更高效表征水分子时空关系

2024-12-18 14:23:00

理论

多种思维链-CoT

2024-12-18 14:53:28

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索