编辑 | 萝卜皮
当前,迫切需要发觉新构造类型的抗生素来解决持续存在的抗生素耐药性危机。深度进修法子有助于试探化学空间;这些通常运用黑盒模型并且不提供化学见地。
麻省理工学院(MIT)的钻研职员开发了一种用于抗生素发觉的深度进修法子,并表明它可以从大型化学库中识别出潜在的抗生素。钻研职员用该法子从药物再利用中心(包含约 6,000 个份子)中发觉了 halicin 和 abaucin,并从 ZINC15 库中的约 1.07 亿个份子中发觉了新的抗菌化合物。
图示:Yann LeCun 转发了这项钻研的 Twitter 报道。(来源:网络)
这类法子依赖于 Chemprop,这是一个图神经网络平台,通常是黑盒模型,或者不容易阐明或阐明的模型。根据定义,阐明此类模型揭示了模型为得出预计而执行的决策步骤的模式(interpretability),或使此类预计可供人类理解(explainability)。
「这里的见地是,我们可以看到模型正在进修什么,以做出某些份子将成为良好抗生素的预计。从化学构造的角度来看,我们的工作提供了一个具有时间效率、资源效率和机械洞察力的框架,这是我们迄今为止所没有的。」麻省理工学院医学工程与科学钻研所(IMES)和生物工程系医学工程与科学 Termeer 教授 James Collins 说道。
IMES、哈佛大学博德钻研所的博士后 Felix Wong 和 Collins 指导下的前哈佛医学院钻研生 Erica Cheng 是该钻研的主要作者,该钻研是 MIT Antibiotics-AI 项目的一部分。
该钻研以「Discovery of a structural class of antibiotics with explainable deep learning」为题,于 2023 年 12 月 20 日 发布在《Nature》。
迫切需要发觉新的抗生素
持续的抗生素耐药性危机可能导致现有抗生素失效,并增加细菌感染的发病率。由于缺乏新的抗生素,这场危机变得更加严重,如果没有新的抗生素,预计到 2050 年全球每年因耐药感染而死亡的人数将达到 1000 万人。
与这类急需的状态相反,抗生素的开发一直缓慢且漫长;从 1962 年推出氟喹诺酮类抗生素到 2000 年推出下一个新构造类型恶唑烷酮,中间间隔了 38 年。
在过去的十年中,通过鉴于天然产物挖掘、高通量筛选、进化和系统发育分析、构造引导和合理设计以及运用机器进修的计算机筛选的各种法子发觉了候选抗生素。然而,开发有效的抗生素发觉法子,更好地利用化学空间的巨大构造多样性仍然是一个挑战,迫切需要新的抗生素发觉法子。
高效的DL模型发觉新抗生素
麻省理工学院的钻研职员通过开发了一种可阐明的、鉴于化学子构造的法子用于高效、深度进修引导的化学空间试探,从而预计和发觉新的抗生素。
该团队确定了 39,312 种化合物的抗生素活性和人体细胞毒性特征,并应用图神经网络集成来预计 12,076,365 种化合物的抗生素活性和细胞毒性。运用可阐明的图形算法,该团队确定了预计具有高抗生素活性和低细胞毒性化合物的鉴于子构造的基本原理。
「你基本上可以将任何份子表示为化学构造,并且你还可以告诉模型该化学构造是否抗菌。」Wong 说,「该模型接受了许多这样的例子的训练。如果你给它任何新的份子、原子和键的新排列,它可以告诉你该化合物被预计具有抗菌性的概率。」
图示:用于预计抗生素活性和人体细胞毒性的深度进修模型集合。(来源:论文)
钻研职员凭经验测试了 283 种化合物,发觉对金黄色葡萄球菌表现出抗生素活性的化合物在鉴于基本原理的推定构造类型中得到了丰富。在这些构造类型的化合物中,其中一种对耐甲氧西林金黄色葡萄球菌(MRSA)和耐万古霉素肠球菌具有选择性,可避免实质性耐药性,并降低 MRSA 皮肤和全身大腿感染小鼠模型中的细菌滴度。
「我们有相当有力的证据表明,这类新的构造类型通过选择性地消散细菌中的质子动力,对革兰氏阳性病原体具有活性。」Wong 说,「这些份子选择性地攻击细菌细胞膜,不会对人体细胞膜造成实质性损害。我们大幅增强的深度进修法子,使我们能够预计这类新的抗生素构造类型,并发觉它对人体细胞没有毒性。」
对于机理和构效关系的分析表明,该构造类型还可以进一步优化,从而提高对革兰氏阳性病原体的选择性,并增加对革兰氏阴性病原体的渗透性。
图示:过滤和可视化化学空间。(来源:论文)
作为一种发觉抗生素构造类型的深度进修法子,该法子系统地建立在对单独化合物命中预计的基础上,并能够对广阔的化学空间进行有效的、鉴于子构造的试探。
除了对化学空间进行下采样之外,该法子的一个重要特征是能够自动识别前所未有的构造图案,特别是在深度进修模型的背景下。这类能力提供了化学新颖性的来源,可以建议化学空间来试探和有效地增强当前的发觉管线,例如,通过为从头设计工作生成感兴趣的化学片段。
重要的是,这类能力无法运用替代法子来实现,例如传统的 QSAR 分析,这些法子建立在已知的支架上,并且不能鉴于概括化学构造中份子原子和键的模式来识别新的支架。
钻研职员估计,更好地理解鉴于图表的基本原理预计可以帮助发觉和设计其他急需的抗生素类型(例如,那些对革兰氏阴性细菌有活性的)以及针对其他生物过程和疾病的药物类型,包括抗病毒和抗癌药物。
药物发觉DL模型变得可阐明
该钻研的另一个重要意义是药物发觉中的深度进修模型可以得到阐明。事实上,机器进修中常用的黑盒模型的一个基本限制是,此类模型通常不向底层决策过程提供信息。然而,模型的可阐明性可能会带来普遍的见地,从而更好地为试探化学空间的下一代法子的运用和开发提供信息。
该钻研表明,运用鉴于图的搜索来概括模型预计的化学子构造基本原理,可以更好地理解和阐明图神经网络。这为特定模型或模型集合所学到的内容提供了有意义的化学见地。
钻研职员表示,他们未来的工作将鉴于这类法子和类似的法子来进一步分析和理解深度进修模型生成的预计,例如,通过运用以扰动模型输入为中心的法子来进行额外的可阐明性测试,以及扰动神经网络构造以实现可阐明性。
「我们已经在利用鉴于化学子构造的类似法子来从头设计化合物,当然,我们可以很容易地采用这类开箱即用的法子来发觉针对不同病原体的新型抗生素。」Wong 说。
论文链接:https://www.nature.com/articles/s41586-023-06887-8
相关报道:
https://phys.org/news/2023-12-ai-class-antibiotic-candidates-drug-resistant.html
https://www.nature.com/articles/d41586-023-03668-1
Nature research paper: Discovery of a structural class of antibiotics with explainable deep learning https://t.co/MXGoEPYpe4
— nature (@Nature) December 21, 2023