高效且准确,郑州大学团队开发新AI工具识别药物-靶标相互作用

编辑 | 枯叶蝶准确识别药物-靶标相互作用(DTI)是药物发现和药物重新定位过程中的关键步骤之一。目前,已经提出了许多基于计算的模型来预测 DTI,并取得了一些显著的进步。然而,这些方法很少关注如何以适当的方式融合与药物和靶标相关的多视角相似性网络。此外,如何充分结合已知的相互作用关系来准确表示药物和靶标尚未得到很好的研究。因此,仍然需要提高 DTI 预测模型的准确性。在最新的研究中,郑州大学、电子科技大学团队提出了一种新方法 MIDTI,该方法采用多视图相似性网络融合策略和深度交互式注意机制来预测药物-靶标相互作

图片

编辑 | 枯叶蝶

准确识别药物-靶标相互作用(DTI)是药物发现和药物重新定位过程中的关键步骤之一。目前,已经提出了许多基于计算的模型来预测 DTI,并取得了一些显著的进步。

然而,这些方法很少关注如何以适当的方式融合与药物和靶标相关的多视角相似性网络。此外,如何充分结合已知的相互作用关系来准确表示药物和靶标尚未得到很好的研究。因此,仍然需要提高 DTI 预测模型的准确性。

在最新的研究中,郑州大学、电子科技大学团队提出了一种新方法 MIDTI,该方法采用多视图相似性网络融合策略和深度交互式注意机制来预测药物-靶标相互作用。

结果表明,MIDTI 在 DTI 预测任务上的表现明显优于其他基线方法。消融实验的结果也证实了多视角相似网络融合策略中注意力机制和深度交互注意力机制的有效性。

该研究以「Drug–target interaction predictions with multi-view similarity network fusion strategy and deep interactive attention mechanism」为题,于 2024 年 6 月 6 日发布在《Bioinformatics》。

图片

药物靶点交互(DTI)预测在新药研发与再利用过程中占据核心地位,传统湿实验方法成本高昂、耗时长久,促使研究者转向计算辅助的药物筛选方法来加速进程。

计算型 DTI 预测主要分为基于结构的方法、基于配体的方法和基于机器学习的方法三类。基于结构的方法依赖药物分子与靶点结构及结合位点,但受限于某些靶点如膜蛋白结构信息的缺乏;基于配体的方法则基于已知活性小分子建立模型,但在靶点结合配体数量有限时效果不佳。

近年来,机器学习方法广泛应用,通过提取药物化学结构和靶点基因序列特征进行二元分类,预测潜在 DTI。然而,目前的方法仅基于药物和靶点自身结构学习表征,忽视了 DTI 对之间的相互作用。

除化学和基因组特征外,生物实体间关系蕴含丰富语义信息,构建融合异构信息的网络有助于系统理解 DTI。但是已有的方法难以一致利用异构网络中的复杂关系。

受多视角相似性网络融合策略和深度交互式注意力机制的启发,郑州大学团队提出了一种称为 MIDTI 的预测 DTI 的新方法。

图片

图示:MIDTI的整体框架。(来源:论文)

MIDTI 的整体框架主要包含四个步骤:

首先,MIDTI 根据药物相关关联信息构建不同的药物相似性网络,并采用多视角相似性网络融合策略获得集成的药物相似性网络。MIDTI 也类似地建立了集成目标相似性网络。

其次,MIDTI 采用 GCN 作为编码器,分别从综合药物相似性网络、综合目标相似性网络、药物-目标二分网络以及药物-目标异构网络中学习药物和目标嵌入。

第三,MIDTI 利用深度交互式注意机制,根据已知的 DTI 关系学习判别嵌入。

最后,研究人员将学习到的药物-靶标对表征输入到多层感知器(MLP)中,以预测 DTI。

图片

图示:多视角药物相似性网络融合策略的四个步骤。(来源:论文)

为了评估MIDTI的性能,研究者采用了多种评估指标,包括准确率(ACC)、曲线下面积(AUC)、精确-召回曲线下面积(AUPR)、F1 分数和马修斯相关系数(MCC)。研究人员将 MIDTI 与其他十种竞争性方法进行了比较,这些方法包括随机森林、图卷积网络、图注意力网络、MMGCN、GraphCDA 和 DTINet 等。

MIDTI 在 ACC、AUC 和 AUPR 指标上分别获得了 0.9340、0.9787和 0.9701 的分数,比 MMGCN 和 GraphCDA 的最高分数高出 2.55%、2.31% 和 2.30%。这表明 MIDTI 在预测药物-靶点相互作用方面是最具竞争力的方法之一。在不同正负样本比例的实验中,MIDTI 也表现出了优秀的性能。

图片

图示:对 MIDTI 在不同时期学习到的药物目标嵌入进行可视化。(来源:论文)

研究还展示了 MIDTI 学习到的药物-靶点嵌入的可视化结果,使用 t-SNE 工具将嵌入映射到二维空间。随着训练轮数的增加,正例和反例逐渐被区分开来,这证明了 MIDTI 所学习的嵌入具有良好的区分力和解释性,从而提高了 DTI 预测的准确性。

MIDTI 的核心贡献在于:它提出了一种新的多视角相似网络融合策略,可以在无监督的方式下整合不同相似网络;使用深度交互注意力机制,根据已知的 DTI 信息学习药物和靶点的判别性表示;大量实验证明 MIDTI 在 DTI 预测任务上优于其他先进的方法。

总之,MIDTI 是一种高效且准确的药物-靶点相互作用预测方法,其创新点在于利用多视角信息和深度注意力机制来增强预测能力。

研究人员表示,接下来将从以下两个方面开展工作。首先,利用药物和靶标的其他相关数据源进行嵌入学习。其次,MIDTI 可以应用于其他链接预测问题,例如 miRNA 与疾病关联预测。

相关报道:https://academic.oup.com/bioinformatics/article/40/6/btae346/7688335

相关资讯

如何让细胞进行计算?国内四高校提出生物计算元器件设计全新方法,登Cell

编辑 | 萝卜皮作者 | 论文团队细胞犹如一台计算机,每时每秒都在接收、分析和处理来自环境中的不同信息:外界信息通过细胞内高度并行的信号转导途径进行分析和处理,进而以预定义的方式从「存储设备」(即 DNA)中读取信息(基因的表达)或写入指令(DNA 修饰和编辑),指导自身或周围细胞对环境信息做出响应。一直以来,如何有效利用生物体本身的计算能力,通过对生物体进行改造使之能够执行人类给定的计算任务,并由此开发出基于生物系统的新概念计算机都是计算机科学与生物技术领域交叉融合的热点问题。近期,来自国防科技大学、西湖大学、浙

上交大、复旦中山团队开发糖尿病专用大语言模型,助力个性化糖尿病管理

编辑 | ScienceAI随着全球糖尿病患病率的逐年攀升,糖尿病已成为全球范围内极具挑战的公共健康问题。据统计,全球约有 10% 的人口受到糖尿病的影响。到 2045 年,全球糖尿病患者人数预计将攀升至惊人的 7.83 亿。然而,由于糖尿病医生短缺、医疗资源分布不均以及患者自我管理能力的不足,糖尿病的管理和治疗仍面临重重困难。如何高效、智能化地管理糖尿病,已成为当前医学界和科技界共同关注的重要课题。为应对这一挑战,上海交通大学清源研究院 MIFA 实验室与复旦大学附属中山医院内分泌科组成的研究团队,联手开发出一款

TMI2024 | 阿大、同济等提出TraCoCo,用于3D医学图像半监督分割

编辑 | ScienceAI3D 医学图像分割方法已经取得了成功,但它们对大量体素级标注数据的依赖是一个需要解决的缺点,因为获取这些标注的成本很高。 半监督学习(SSL)通过使用大量未标注数据和少量标注数据进行模型训练,解决了这一问题。 最成功的 SSL 方法基于一致性学习,即通过最小化从扰动视图中获得的模型响应之间的距离来实现的。