编辑 | 凯霞
全球每年有近 500 万人死于抗生素耐药性,因此迫切需要新的格式来对抗耐药菌株。
AI 格式可以发现新的抗生素,但现有格式有明显的局限性。性质猜测模型很难扩展到大型化学空间。直接安排份子的生成模型可以快速探索广阔的化学空间,但生成的份子难以分解。
在此,斯坦福大学和麦克马斯特大学(McMaster University)的研讨人员发明了一种新的生成式 AI 模型 SyntheMol,可以安排数十亿种新的抗生素份子,这些份子价格低廉且易于在实验室中分解。
SyntheMol 可以从近 300 亿个份子的化学空间中安排易于分解的新化合物。该模型可以安排新的抗生素来阻止鲍曼不动杆菌的传播。发现 6 个结构现代的份子表现出对鲍曼不动杆菌的抗菌活性。
论文作者、斯坦福大学生物医学数据科学副教授 James Zou 说,「SyntheMol 不仅安排了有希望的候选药物的现代份子,而且还生成了如何制造每种新份子的配方。」
全球健康药物研发中心(GHDDI)首席科学官张儒民博士表示:「生成式 AI 模型 SyntheMol 在短短三个月之内,安排出六款活性不错(当然有待进一步改进)的结构现代且易于分解的抗生素候选份子。我们因此有理由乐观地预期,在不远的将来,AI 必将大幅提升制药成功率,缩短制药周期,降低研发成本,更快造福人类。」
相关研讨以《Generative AI for designing and validating easily synthesizable and structurally novel antibiotics》为题,于 2024 年 3 月 22 日发布在《Nature Machine Intelligence》上。
论文链接:https://www.nature.com/articles/s42256-024-00809-7
耐药细菌在全球范围内的传播迫切需要新的抗生素,但即使是现代 AI 格式在分离有希望的化合物方面也受到限制,特别是当研讨人员还必须找到制造这些新的 AI 引导药物并在实验室中尝试它们的格式时。
众所周知,鲍曼不动杆菌很难根除,可引起肺炎、脑膜炎和伤口感染,所有这些都可能导致死亡。世界卫生组织已将鲍曼不动杆菌确定为世界上最危险的耐抗生素细菌之一。但几乎没有什么治疗选择。
该论文的第一作者,麦克马斯特大学生物医学与生物化学系助理教授 Jonathan Stokes 说,「抗生素是一种独特的药物。一旦我们开始在临床上使用它们,我们就会在药物失效之前开始计时,因为细菌会迅速进化以抵抗它们。我们需要强大的抗生素管道,需要快速且廉价地发现它们。这就是 AI 发挥关键作用的地方。」
SyntheMol 安排出 6 个结构现代且易于分解的抗生素份子
研讨人员开发了生成模型,可以快速、廉价地获取数百亿个有希望的份子。
SyntheMol 使用蒙特卡洛树搜索(MCTS),从包含 132,000 个份子片断的库中提取数据,这些片断像乐高积木一样拼凑在一起,但本质上却截然不同。
然后,他们将这些份子片断与一组 13 个化学反应进行交叉引用,使其能够识别 300 亿个片断的双向组合,从而安排出具有最有希望的抗菌特性的新份子。
图示:SyntheMol 模型。(来源:论文)
研讨训练 SyntheMol 来安排对鲍曼不动杆菌具有抗生素活性的份子,分解并通过实验验证了所生成的 58 个份子。
该模型安排的每个份子依次通过另一个经过训练来猜测毒性的人工智能模型。该过程产生了六种份子,它们对鲍曼不动杆菌具有有效的抗菌活性,而且无毒。
图示:生成式 AI 用于抗生素发现。(来源:论文)
科学家们能够进一步尝试六种化合物中的两种对小鼠的毒性,因为其他四种不溶于水。他们尝试的两个似乎是安全的;下一步是在感染鲍曼不动杆菌的小鼠身上尝试这些药物,看看它们是否在活体中起作用。
难得一见的 10% 高成功率
张儒民博士认为,该研讨有至少如下几个可资学习的亮点:
(1)作者首先实测了一万多种化合物对鲍曼不动杆菌的抑菌活性,用这些可靠数据训练「活性猜测」模型。这是非常必要的、扎扎实实的基本功。
(2)从头就着眼于「易于分解、结构现代的小份子」,使用常见的 13 个化学反应和 132,000 个小份子构建块,可以虚拟搭建高达近 300 亿个易于分解的小份子。当然,绝大多数化合物并不具有生物活性。
(3)用生成式人工智能 SyntheMol 模型,基于上述实测数据的「活性猜测」建模,在短短八个半小时内完成的 20,000 次迭代份子生成中,安排出近 3,000 款预期具有抗菌活性的候选份子(其中三分之一在头 2,000 次迭代中即生成了)。
(4)最后遴选出 58 个现代、多元、猜测有高活性的份子,并在实验室实际分解出来。其中 6 个份子有相当好的广谱抗菌活性,且有足够低的耐药几率。这代表了难得一见的 10% 高成功率!
图示:生成模型开发。(来源:论文)
张儒民博士补充道:「该研讨也存在一定局限性,SyntheMol 模型还不能一步或寥寥几步到位,快速优化安排最后具备完整成药性的、可推到人体临床试验的现代药物份子。AI 赋能制药的科技革命尚未成功,药业同仁仍需努力。」
研讨人员也正在改进 SyntheMol 并扩大其范围。他们正在与其他研讨小组合作,利用该模型来发现治疗心脏病的药物,并为实验室研讨创造新的荧光份子。
参考内容:https://phys.org/news/2024-03-artificial-intelligence-superbug-antibiotics.html
https://techxplore.com/news/2024-03-generative-ai-potential-drugs-antibiotic.html
注:封面来自网络。