预测配体-靶标对的结合亲和力,哈工大开发新SOTA药物表示模型

编辑 | 白菜叶了解配体-靶标对的分子间相互作用是指导优化癌症药物研究的关键,这可以大大减轻湿实验室的负担。当前计算方法存在一些缺陷,限制了它们的实际应用。在这里,哈尔滨工业大学的研究人员在此提出了 DrugMGR,这是一种深度多粒度药物表示模型,能够预测每个配体-靶标对的结合亲和力和区域。通过对配体复杂的自然机制和蛋白质高级特征的多粒度表示学习,DrugMGR 几乎在所有数据集上都显著优于当前最先进的方法。并且,这是第一个同时使用图、卷积和基于注意力的信息分析蛋白质-配体复合物的模型。该研究以「DrugMGR:

预测配体-靶标对的结合亲和力,哈工大开发新SOTA药物表示模型

编辑 | 白菜叶

了解配体-靶标对的分子间相互作用是指导优化癌症药物研究的关键,这可以大大减轻湿实验室的负担。当前计算方法存在一些缺陷,限制了它们的实际应用。

在这里,哈尔滨工业大学的研究人员在此提出了 DrugMGR,这是一种深度多粒度药物表示模型,能够预测每个配体-靶标对的结合亲和力和区域。

通过对配体复杂的自然机制和蛋白质高级特征的多粒度表示学习,DrugMGR 几乎在所有数据集上都显著优于当前最先进的方法。并且,这是第一个同时使用图、卷积和基于注意力的信息分析蛋白质-配体复合物的模型。

该研究以「DrugMGR: a deep bioactive molecule binding method to identify compounds targeting proteins」为题,于 2024 年 4 月 1 日发布在《Bioinformatics》。

图片

药物开发对于疾病治疗至关重要,科学家们通过药物再利用可以快速寻找治疗方案,但传统实验方法成本高、周期长,限制了其应用。相比之下,采用计算方法识别高可信度的配体-靶标相互作用,能够显著缩小化合物候选范围,揭示蛋白质-配体复合物的结合机制。

过去十年,生物活性分子数据的激增,推动了深度学习与人工智能在研究蛋白质-配体相互作用中的应用。

然而,现有深度学习方法存在两方面问题:一是多数模型对多粒度配体特征的捕获能力不足,未能充分整合原子环境、化学基因组序列等多元自然机制信息;二是许多方法忽视了对结合区域可解释性的构建,虽有少数借助注意力机制尝试推断结合位点,但关联生物特征不明确,不利于指导研究人员定位结合位点。

为了应对这些缺陷,哈尔滨工业大学的研究人员提出了 DrugMGR,这是一种基于深度多粒度表示的模型,可以预测配体与蛋白质靶标的结合亲和力和区域。

图片

图示:DrugMGR 方法概述。(来源:论文)

具体来说,该团队首先使用三个深度模块来全面编码配体的自然机制,即,用图注意力网络 (GAT) 来建模原子环境,用 CNN 来提取全局化学基因组序列,并使用分子Transformer (MT) 来捕获局部子结构的相互影响。

研究人员还设计了一个并行 VAE 模块,通过 CNN 块在概率编码器中学习蛋白质的高级特征,然后在概率解码器中重建目标结构。

然后,配体和蛋白质的编码表示被输入由注意力网络组成的成对相互作用映射模块,从而学习蛋白质-配体复合物的相互作用模式。联合成对相互作用表示由完全连接的网络解码,用于预测生物活性分子的结合亲和力。

图片

图示:BindingDB 数据集随机分割和冷启动分割的性能比较。(来源:论文)

对于结合区域预测,研究人员首先突出显示具有与配体结合潜力的重建蛋白质的结合位点,作为原始结合区域。随后,使用卷积运算将多粒度配体特征与蛋白质特征相乘。

接下来,他们将卷积结果记录为每个配体-靶标对的响应向量,并将响应向量中具有高值的区域标记为可视化结合区域。最后,研究人员利用这两个区域来指导最终预测的结合区域。

与 DrugBAN(一种用于简单识别药物和靶标之间相互作用的二元分类器)相比,该团队提出的 DrugMGR 可以进一步了解蛋白质-配体复合物的综合结合信息(结合亲和力和结合区域),这在生物活性分子结合的实际应用中发挥着核心作用。

图片

图示:已识别药物 Talazoparib 和靶向 PARP1 在三个预测区域的可视化。(来源:论文)

针对具有高度侵袭性、预后不良且缺乏有效靶向疗法的三阴性乳腺癌(TNBC),该团队利用 DrugMGR 模型从 DrugBank 数据库中识别针对 PARP1 的潜在抑制剂和化疗药物。

筛选出的前 10 个候选化合物经 GeneCards 和 PDB 系统验证,并通过可视化 PARP1 与 Talazoparib(PDB ID: 4PJT)的结合区域,确认模型的有效性。

结果显示,DrugMGR 准确预测了结合位点,表现优异,有望成为针对 PARP1 虚拟筛选的有力工具,助力生物医药学家筛选更优的抗肿瘤药物组合。

论文链接:https://academic.oup.com/bioinformatics/article/40/4/btae176/7638803

相关资讯

中国第一台全天候激光智能除草机器人落地:哈工大新成果,环境零污染

据华工科技消息,6 月 5 日-7 日,华工科技中央研究院同哈尔滨工业大学机器人技术与系统全国重点实验室(简称哈工大机器人实验室)正式签约并举行专家聘任仪式,中国第一台全天候激光智能除草机器人落地。据介绍,哈工大机器人实验室与华工科技合作研发的中国第一台全天候智能激光除草机器人,以“环境零污染、土地零破坏、昼夜作业”为研发目标,实现了该领域的国内首创,目前已经在黑龙江黑河市爱辉区开展田间试验。据介绍,激光除草是通过激光照射杂草,使草叶内部细胞脱水破裂死亡的物理靶向除草方法。全天候智能激光除草机器人集成深度学习的人工

通过深度学习预测离散时间分岔

编辑 | 白菜叶许多自然和人造系统都容易发生关键转变——动态方面的突然且可能具有破坏性的变化。深度学习分类器可以通过从大型模拟训练数据集中学习分叉的通用特征,为关键转变提供预警信号。到目前为止,分类器仅被训练来预测连续时间分岔,忽略了离散时间分岔所特有的丰富动态。在这里,麦吉尔大学(McGill University)Thomas M. Bury 的研究团队训练一个深度学习分类器,为余维一的五个局部离散时间分岔提供预警信号。他们使用生理学、经济学和生态学中使用的离散时间模型的模拟数据以及经历倍周期分岔的自发跳动的鸡

可在数据限制下训练高维因果结构,德国DZNE团队提出一种深度神经架构

编辑 | 萝卜皮因果学习是科学人工智能的一个关键挑战,因为它使研究人员能够超越纯粹的相关或预测分析,学习潜在的因果关系,这对于科学理解以及广泛的下游任务非常重要。受新兴生物医学问题的启发,德国神经退行性疾病中心(German Center for Neurodegenerative Diseases,DZNE)的研究人员提出了一种深度神经架构,用于从高维数据和先验因果知识的组合中学习变量之间的因果关系。该团队将卷积神经网络和图神经网络结合在因果风险框架内,提供了一种在高维、噪声和数据限制条件下明显有效的方法,这些条