准确预测药物-靶点相互作用,江南大学提出深度学习融合GNN新方法MINDG

编辑 | 紫罗药物-靶点相互作用(DTI)预测在药物发现中发挥着重要作用。尽管药物靶点预测的智能计算方法受到了广泛关注,并取得了许多进展,但仍然是一项具有挑战性的任务,需要进一步的研究。为了解决上述挑战,江南大学研究团队提出了一种集成深度学习和图学习的多视图集成学习网络(MINDG)。MINDG 结合图学习和深度学习来提取药物和蛋白质的内在结构信息,以及它们之间的外在关系信息。因此,与之前的方法相比,MINDG 提高了模型预测的性能。相关研究以《MINDG: a drug–target interaction pr

图片

编辑 | 紫罗

药物-靶点相互作用(DTI)预测在药物发现中发挥着重要作用。尽管药物靶点预测的智能计算方法受到了广泛关注,并取得了许多进展,但仍然是一项具有挑战性的任务,需要进一步的研究。

为了解决上述挑战,江南大学研究团队提出了一种集成深度学习和图学习的多视图集成学习网络(MINDG)。

MINDG 结合图学习和深度学习来提取药物和蛋白质的内在结构信息,以及它们之间的外在关系信息。因此,与之前的方法相比,MINDG 提高了模型预测的性能。

相关研究以《MINDG: a drug–target interaction prediction method based on an integrated learning algorithm》为题,于 2024 年 3 月 14 日发布在《Bioinformatics》上。

图片

GitHub 地址:https://github.com/jnuaipr/MINDG

论文链接:https://doi.org/10.1093/bioinformatics/btae147

四种 DTI 预测方法

DTI 预测指预测给定的药物分子是否会与特定靶点结合,从而发挥靶向治疗作用。

目前 DTI 预测方法主要有四类:基于相似性的方法、机器学习方法、深度学习方法和图学习方法。

基于相似性的方法,例如,阿卜杜拉国王科技大学 (KAUST) Thafar 团队提出的 DTi2Vec 方法可以预测药物和蛋白质之间的联系,而无需挖掘药物和蛋白质的额外内部信息。

机器学习方法利用蛋白质结构和序列信息来预测目标。例如,使用化学结构、药物质谱和氨基酸序列来表示蛋白质以预测药物-靶标相互作用。

深度学习方法将特征、模型和生物信息学网络与其他方法相结合,以获得更好的预测结果。

目前,在 DTI 预测的可用方法中,基于图卷积网络(GCN)的方法最有前景。

药物靶标预测的智能计算方法受到了广泛关注并取得了重大进展。然而,这仍然是一项具有挑战性的任务。

主要挑战表现为:(i)大多数基于图神经网络(GNN)的方法只考虑图中一阶相邻节点(药物和靶标)的信息,而没有从高阶相邻节点中学习更深入、更丰富的结构特征。(ii)现有方法没有同时考虑药物和靶标的序列和结构特征,各方法相互独立,无法结合序列和结构特征的优点来提高交互式学习效果。

MINDG 提高了 DIT 预测性能

为了应对这一挑战,该研究提出了一种集成深度学习和图学习的多视图集成学习网络(MINDG)。

图片

图示:MINDG 模型的总体架构。(来源:论文)

该网络由以下部分组成:(i)采用混合深度网络(HDN)提取药物和靶点的序列特征,(ii)提出了高阶图注意卷积网络以更好地提取和捕获结构特征,(iii)使用多视图自适应集成决策模块对上述两种网络的初始预测结果进行改进和补充,提高预测性能。

图片

图示:混合深度网络(HDN)的结构图。(来源:论文)

该研究的贡献主要体现在三个方面:

设计药物和蛋白质靶标图学习的注意力机制,并提出高阶图注意力卷积网络(HOAGCN)。

融合消息传递神经网络 (MPNN) 和卷积神经网络(CNN)方法来增强药物和蛋白质目标序列的结构特征学习;。

提出集成深度学习和图学习的多视图集成学习网络(MINDG)。

图片

图示:高阶图注意力卷积网络(HOAGCN)的结构。(来源:论文)

实验研究

为了验证 MINDG 的有效性,在以下方面进行了实验分析:(i)与当前性能较好的药物-靶点相互作用预测方法的性能比较;(ii) 进行了消融实验;(iii) 进行了预测结果的应用研究。

在两个数据集上(BindingDB 和 DAVIS)评估 MINDG,表明与最先进的基线相比,它提高了 DTI 预测性能。MINDG 结合了图神经网络和深度学习方法的优点,比单独使用任何一种方法都有更好的性能。

图片

图片

接下来,进行了消融分析,研究了多视图学习对预测性能的影响。

图片

从实验结果中可以看出,与 View1、View2 和 MAIDM 相比,MINDG 改进了所有数据集的指标。无论使用哪种单独视图,相应模型的预测能力都弱于基于两种视图协同的预测性能。这也表明多个视图具有互补作用,通过它们的协同作用,可以更充分地利用高阶图注意力网络和混合深度网络学习到的不同视图的深层特征,从而提高整体模型的性能。

最后,利用 MINDG 进行抗病毒药物再利用的探索。使用由清华大学 Gao Yan 等人解析的 SARS-CoV-2 3CL 蛋白酶序列输入模型,预测结合亲和力值排名前 10 的药物。

图片

在 MINDG 生成的候选药列表中药物疗效的实际应用,有助于证明 MINDG 预测结果的信息价值。

不足和改进方向

MINDG 与一些最先进的方法进行了各种比较,结果表明所提出的方法性能更佳。

然而,MINDG 只是以顺序的方式学习药物和蛋白质的内在结构信息,并没有充分利用所有可用的内在结构信息。

未来,图学习方法可能会被用来学习药物和蛋白质的内在结构。此外,由于研究有限,研究人员还没有进行湿实验阶段。计划将来进行进一步的湿实验,包括药物 panel 测试。

【推荐阅读】

药物分子设计新策略,微软条件扩散模型DiffLinker登Nature子刊

可发现药物靶点,哈佛、Hopkins、中国科学院等机构基于Transformer开发了一种可对蛋白翻译动态变化建模的深度学习方法

100%化学有效,高度类似药物,川大开发数据和知识双驱动的AI分子生成框架

进行药物靶标亲和力预测,浙大&华科大团队开发扩展图学习卷积网络方法

药物-靶标亲和力预测,上科大团队开发了一种Transformer编码器和指纹图谱相结合的方法

中科大团队提出 SDGAE,一种基于图卷积自编码器的 DTI 预测方法

相关资讯

综述:药物发现中的机器学习

编辑 | 萝卜皮不知不觉,人工智能已经渐渐延伸到了各个领域,医药领域也不例外。来自印度 B V Raju 理工学院的研究人员发表综述,讨论了药物发现中的机器学习,归纳总结了应用于制药领域的各类机器学习技术,并指出当前该领域发展的难点,以及未来发展方向。该综述以「Machine Learning in Drug Discovery: A Review」为题,于 2021 年 8 月 11 日发布在《Artificial Intelligence Review》杂志。人工智能概念与许多领域密切相关,如模式识别、概率论、

人工智能为新药铺平道路:几何深度学习方法可以预测合成药物分子的最佳方案

编辑 | 萝卜皮后期功能化是优化候选药物特性的一种经济方法。然而,药物分子的化学复杂性往往使得后期多样化具有挑战性。为了解决这个问题,德国慕尼黑大学(Ludwig-Maximilians-Universität München)、苏黎世联邦理工学院(ETH Zurich)和巴塞尔罗氏制药(Roche Innovation Center Basel)的研究人员开发了基于几何深度学习和高通量反应筛选的后期功能化平台。考虑到硼基化是后期功能化的关键步骤,计算模型预测了不同反应条件下的反应产率,平均绝对误差范围为 4-5%

经典教材《统计学习导论》第二版来了,新增深度学习等内容,免费下载

经典的《统计学习导论》又出第二版了,相比于第一版,新版增加了深度学习、生存分析、多重测试等内容,可免费下载。