辉瑞 AI 方法登 Science,揭示数以万计的配体-蛋白质相互作用

编辑 | X尽管蛋白质结构预测取得了重大进展。但对于 80% 以上的蛋白质,迄今为止尚未发现小分子配体。识别大多数蛋白质的小分子配体仍具有挑战性。现在,奥地利科学院分子医学研究中心 CeMM 的研究人员与辉瑞公司合作,开发了一种方法来预测数百种小分子与数千种人类蛋白质的结合活性。这项大规模研究揭示了数以万计的配体-蛋白质相互作用,通过探索这些相互作用,从而可以开发化学工具和治疗方法。此外,在机器学习和人工智能的支持下,它可以「公正」地预测小分子如何与活体人类细胞中存在的所有蛋白质相互作用。相关研究以《Large-s

辉瑞 AI 方法登 Science,揭示数以万计的配体-蛋白质相互作用

编辑 | X

尽管蛋白质结构预测取得了重大进展。但对于 80% 以上的蛋白质,迄今为止尚未发现小分子配体。识别大多数蛋白质的小分子配体仍具有挑战性。

现在,奥地利科学院分子医学研究中心 CeMM 的研究人员与辉瑞公司合作,开发了一种方法来预测数百种小分子与数千种人类蛋白质的结合活性。

这项大规模研究揭示了数以万计的配体-蛋白质相互作用,通过探索这些相互作用,从而可以开发化学工具和治疗方法。

此外,在机器学习和人工智能的支持下,它可以「公正」地预测小分子如何与活体人类细胞中存在的所有蛋白质相互作用。

相关研究以《Large-scale chemoproteomics expedites ligand discovery and predicts ligand behavior in cells》为题,于 4 月 26 日发表在《Science》杂志上。

辉瑞 AI 方法登 Science,揭示数以万计的配体-蛋白质相互作用

论文链接:https://www.science.org/doi/10.1126/science.adk5864

大多数药物都是影响蛋白质活性的小分子。如果充分理解这些小分子,它们也是表征蛋白质行为和进行基础生物学研究的宝贵工具。

鉴于这些重要作用,令人惊讶的是,对于 80% 以上的蛋白质,迄今为止尚未发现小分子结合物。这阻碍了新药和治疗策略的开发,同样也阻碍了对健康和疾病的新生物学见解。

辉瑞 AI 方法登 Science,揭示数以万计的配体-蛋白质相互作用

图示:配体发现方法的示意图。(来源:论文)

为了缩小这一差距,CeMM 的研究人员与辉瑞公司合作扩大并扩展了一个实验平台,使他们能够预测数百种具有不同化学结构的小分子如何与活细胞中所有表达的蛋白质相互作用。

这产生了数以万计的配体-蛋白质相互作用的丰富目录,现在可以进一步优化这些目录,来代表进一步治疗开发的起点。

具体而言,研究人员使用化学蛋白质组学方法来绘制人类蛋白质组中蛋白质-配体相互作用的图谱。通过附着在光活化交联剂的约 400 个配体片段的文库,作者鉴定了约 2500 个蛋白质中的约 50,000 个具有统计显著性的相互作用,其中包括大部分之前没有已知配体的靶标。

并通过生化实验验证了这些结果,从筛选中鉴定出 E3 连接酶粘合剂和跨膜转运蛋白抑制剂。

集成机器学习二元分类器进一步实现了细胞中片段行为的可解释预测。由此产生的片段-蛋白质相互作用和预测模型的资源将有助于阐明分子识别原理,并加快迄今为止未药物化的蛋白质的配体发现工作。

在该研究中,由 CeMM PI Georg Winter 领导的团队通过开发细胞转运蛋白的小分子结合物、细胞降解机制的成分,以及参与细胞信号转导的未被充分研究的蛋白质来证明这一点。

辉瑞 AI 方法登 Science,揭示数以万计的配体-蛋白质相互作用

图示:片段混杂预测。(来源:论文)

此外,利用大数据集,开发了机器学习和人工智能模型,可以预测其他小分子如何与活人类细胞中表达的蛋白质相互作用。

研究人员利用完全功能化片段(Fully functionalized fragment,FFF)描述符,将其与一个快速、轻量级、全自动的 ML 算法相结合,用于二元分类。

简而言之,首先根据蛋白质相互作用计数的阈值将筛选的片段标记为混杂(1)或非混杂(0)。然后,使用基于 Transformer 的 ML 模型(TabPFN)将化合物的 FFF 描述符映射到分类分数(0 或 1)。

TabPFN 是一个完全学习的模型,它近似于贝叶斯推理,不需要超参数调优,因此可以根据化学蛋白质组学分析数据直接获得高性能的 ML 分类器。

通过这种方法,混杂模型还可以了解结合蛋白质的特异性。

「我们惊讶地发现 AI 和机器学习如何提高我们对人类细胞中小分子行为的理解。我们希望我们的小分子-蛋白质相互作用目录和相关的 AI 模型现在可以为药物发现方法提供一条捷径。」Winter 说。

为了最大限度地发挥科学界的潜在影响和实用性,所有数据和模型都通过网络应用程序免费提供(开源地址:https://ligand-discovery.ai)。

辉瑞公司副总裁兼药物设计主管 Patrick Verhoest 博士说。「这是工业界和学术界的杰出合作。我们很高兴向大家展示,我们团队三年密切合作所取得的成果。这是一个伟大的项目。」

参考内容:https://phys.org/news/2024-04-shortcut-drug-discovery-method-large.html

相关资讯

「AI+物理先验知识」,浙大、中国科学院通用蛋白质-配体相互作用评分方法登Nature子刊

编辑 | X蛋白质就像是身体中的精密锁具,而药物分子则是钥匙,只有完美契合的钥匙才能解锁治疗之门。科学家们一直在寻找高效的方法来预测这些「钥匙」和「锁」之间的匹配度,即蛋白质-配体相互作用。然而,传统的数据驱动方法往往容易陷入「死记硬背」,记住配体和蛋白质训练数据,而不是真正学习它们之间的相互作用。近日,浙江大学和中国科学院研究团队,提出了一种名为 EquiScore 的新型评分方法,利用异构图神经网络整合物理先验知识,并在等变几何空间中表征蛋白质-配体相互作用。EquiScore 基于一个新数据集进行训练,该数据

准确率达0.96,从序列中预测蛋白-配体互作的物理化学约束图神经网络

编辑 | 萝卜皮在药物研发中,确定小分子配体对蛋白质的结合亲和力和功能效应至关重要。目前的计算方法可以预测这些蛋白质-配体相互作用特性,但如果没有高分辨率的蛋白质结构,通常会失去准确性,并且无法预测功能效应。莫纳什大学(Monash University)和格里菲斯大学(Griffith University)的研究人员开发了 PSICHIC(PhySIcoCHemICal graph neural network),这是一个结合物理化学约束的框架,可直接从序列数据解码相互作用指纹(fingerprints)。这使

登Nature子刊,拓扑Transformer模型进行多尺度蛋白质-配体互作预测,助力药物研发

编辑 | 萝卜皮一项新的人工智能应用将帮助研究人员提高药物研发能力。该项目名为 TopoFormer,是由美国密歇根州立大学(Michigan State University)数学系 Guowei Wei 教授领导的跨学科团队开发的。TopoFormer 将分子的三维信息转化为典型的基于人工智能的药物相互作用模型可以使用的数据,扩展了这些模型预测药物有效性的能力。「有了人工智能,你可以让药物研发更快、更高效、更便宜。」Wei 说,他同时在生物化学和分子生物学系以及电气和计算机工程系任职。Wei 教授解释道,在美国