编辑 | X
尽管蛋白质结构展望取得了重大进展。但对于 80% 以上的蛋白质,迄今为止尚未发觉小份子配体。识别大多数蛋白质的小份子配体仍具有挑战性。
现在,奥地利科学院份子医学研讨中心 CeMM 的研讨职员与辉瑞公司合作,开发了一种法子来展望数百种小份子与数千种人类蛋白质的结合活性。
这项大规模研讨揭示了数以万计的配体-蛋白质相互作用,通过探索这些相互作用,从而可以开发化学工具和治疗法子。
此外,在机械进修和人工智能的支持下,它可以「公正」地展望小份子如何与活体人类细胞中存在的所有蛋白质相互作用。
相关研讨以《Large-scale chemoproteomics expedites ligand discovery and predicts ligand behavior in cells》为题,于 4 月 26 日发表在《Science》杂志上。
论文链接:https://www.science.org/doi/10.1126/science.adk5864
大多数药物都是影响蛋白质活性的小份子。如果充分理解这些小份子,它们也是表征蛋白质行为和进行基础生物学研讨的宝贵工具。
鉴于这些重要作用,令人惊讶的是,对于 80% 以上的蛋白质,迄今为止尚未发觉小份子结合物。这阻碍了新药和治疗策略的开发,同样也阻碍了对健康和疾病的新生物学见解。
图示:配体发觉法子的示意图。(来源:论文)
为了缩小这一差距,CeMM 的研讨职员与辉瑞公司合作扩大并扩展了一个实验平台,使他们能够展望数百种具有不同化学结构的小份子如何与活细胞中所有表达的蛋白质相互作用。
这产生了数以万计的配体-蛋白质相互作用的丰富目次,现在可以进一步优化这些目次,来代表进一步治疗开发的起点。
具体而言,研讨职员使用化学蛋白质组学法子来绘制人类蛋白质组中蛋白质-配体相互作用的图谱。通过附着在光活化交联剂的约 400 个配体片断的文库,作者鉴定了约 2500 个蛋白质中的约 50,000 个具有统计显著性的相互作用,其中包括大部分之前没有已知配体的靶标。
并通过生化实验验证了这些结果,从筛选中鉴定出 E3 连接酶粘合剂和跨膜转运蛋白抑制剂。
集成机械进修二元分类器进一步实现了细胞中片断行为的可解释展望。由此产生的片断-蛋白质相互作用和展望模型的资源将有助于阐明份子识别原理,并加快迄今为止未药物化的蛋白质的配体发觉工作。
在该研讨中,由 CeMM PI Georg Winter 领导的团队通过开发细胞转运蛋白的小份子结合物、细胞降解机制的成分,以及参与细胞信号转导的未被充分研讨的蛋白质来证明这一点。
图示:片断混同展望。(来源:论文)
此外,利用大数据集,开发了机械进修和人工智能模型,可以展望其他小份子如何与活人类细胞中表达的蛋白质相互作用。
研讨职员利用完全功能化片断(Fully functionalized fragment,FFF)描述符,将其与一个快速、轻量级、全自动的 ML 算法相结合,用于二元分类。
简而言之,首先根据蛋白质相互作用计数的阈值将筛选的片断标记为混同(1)或非混同(0)。然后,使用基于 Transformer 的 ML 模型(TabPFN)将化合物的 FFF 描述符映射到分类分数(0 或 1)。
TabPFN 是一个完全进修的模型,它近似于贝叶斯推理,不需要超参数调优,因此可以根据化学蛋白质组学分析数据直接获得高性能的 ML 分类器。
通过这种法子,混同模型还可以了解结合蛋白质的特异性。
「我们惊讶地发觉 AI 和机械进修如何提高我们对人类细胞中小份子行为的理解。我们希望我们的小份子-蛋白质相互作用目次和相关的 AI 模型现在可以为药物发觉法子提供一条捷径。」Winter 说。
为了最大限度地发挥科学界的潜在影响和实用性,所有数据和模型都通过网络应用程序免费提供(开源地址:https://ligand-discovery.ai)。
辉瑞公司副总裁兼药物设计主管 Patrick Verhoest 博士说。「这是工业界和学术界的杰出合作。我们很高兴向大家展示,我们团队三年密切合作所取得的成果。这是一个伟大的项目。」
参考内容:https://phys.org/news/2024-04-shortcut-drug-discovery-method-large.html