编辑 | 萝卜皮
新兴药物的药物相互作用 (DDI) 为治疗和缓解疾病提供了可能性,利用计算方法准确预测这些相互作用可以改善患者护理并有助于高效的药物开发。然而,许多现有的计算方法需要大量已知的 DDI 信息,这对于新兴药物来说是稀缺的。
清华大学、第四范式(4Paradigm)以及腾讯 Jarvis Lab 的研究人员提出了 EmerGNN,这是一种图神经网络,可以利用生物医学网络中的丰富信息来有效预测新兴药物的相互作用。
EmerGNN 通过提取药物对之间的路径、将信息从一种药物传播到另一种药物以及在路径上结合相关的生物医学概念来学习药物的成对表示。生物医学网络的边缘经过加权以指示目标 DDI 预测的相关性。
总体而言,EmerGNN 在预测新兴药物相互作用方面比现有方法具有更高的准确性,并且可以识别生物医学网络上最相关的信息。
该研究以「Emerging drug interaction prediction enabled by a flow-based graph neural network with biomedical network」为题,于 2023 年 12 月 20 日发布在《Nature Computational Science》。
科学进步和监管变化促进了全球众多新兴药物的开发,特别是针对罕见、严重或危及生命的疾病。这些药物是具有未知或不可预测风险的新物质,因为它们之前没有被广泛监管或使用。例如,尽管已经开发了数百种 COVID-19 药物,但截至 2023 年 10 月,美国食品和药物管理局仅推荐了六种(例如地塞米松和氢化可的松)。
新药的临床部署谨慎且缓慢,因此确定这些新兴药物的药物相互作用 (DDI) 至关重要。为了加快发现潜在 DDI 的速度,人们开发了计算技术,特别是机器学习方法。然而,由于临床试验信息有限,意外的多重用药或副作用可能会很严重且难以检测。
早期的 DDI 预测方法使用手工设计的特征来表示基于药物特性的相互作用。尽管这些方法可以在冷启动环境下直接作用于新兴药物,但它们可能缺乏表达性并且忽略了药物之间的相互联系。DDI 其实可以自然地表示为图表,其中节点代表药物,边代表一对药物之间的相互作用。图学习方法可以学习药物嵌入进行预测,但它们依赖于历史相互作用,因此难以解决新兴药物相互作用数据稀缺的问题。
将大型生物医学网络作为 DDI 预测的辅助信息是仅从 DDI 交互中学习的另一种选择。这些生物医学网络(例如 HetioNet)将事实组织成有向多关系图,记录生物医学概念(例如基因、疾病和药物)之间的关系。图神经网络可以通过聚合拓扑结构和药物嵌入来获得表达节点嵌入,但现有方法没有专门考虑新兴药物,导致在预测它们的 DDI 时性能较差。
在最新的研究中,清华大学、第四范式以及腾讯的研究人员建议通过学习连接目标药物对的生物医学概念,用大型生物医学网络来预测新兴药物的 DDI。虽然新兴药物在 DDI 网络中可能没有足够的相互作用,但它们通常与现有药物的药物开发中使用的生物化学概念相同,例如目标基因或疾病。
因此,该团队利用生物医学网络中给定药物对的相关路径。然而,正确利用这些网络可能具有挑战性,因为它们不是为新兴药物开发的,而且目标的不匹配可能导致机器学习模型学习分散注意力的知识。
图示:EmerGNN 概述。(来源:论文)
为了准确且可解释地预测新兴药物的 DDI,研究人员引入 EmerGNN,这是一种图神经网络 (GNN) 方法,它通过集成生物医学实体和连接它们的关系来学习成对药物表示。基于流的 GNN 架构提取连接药物对的路径,从新兴药物到现有药物的追踪,并沿着路径集成有关生物医学概念的信息。
这种方法利用生物医学和交互网络中的共享信息。为了能够提取相关信息,研究人员对生物医学网络上不同类型的关系进行加权,使得路径上权重较大的边有助于解释。
与其他基于 GNN 的方法相比,EmerGNN 在待预测药物对周围的局部子图上传播,更好地发现生物医学网络内的定向信息流。
图示:分析 DrugBank 数据集上选定路径的关系类型。(来源:论文)
该团队证明了 EmerGNN 对于 DDI 预测的有效性,但其实 EmerGNN 是一种通用方法,可应用于其他生物医学应用,例如预测蛋白质-蛋白质相互作用、药物-靶标相互作用和疾病-基因相互作用。
图示:药物对的可视化。(来源:论文)
研究人员预计 EmerGNN 根据边缘注意力值选择的路径可以提高这些预测的准确性和可解释性。他们希望开源的 EmerGNN 能够作为强大的深度学习工具来推进生物医学和医疗保健,使从业者能够在低数据场景下利用现有大型生物医学网络中的丰富知识。
论文链接:https://www.nature.com/articles/s43588-023-00558-4