编辑 | 萝卜皮
生物活性肽是健康和医学的关键分子。深度进修为生物活性肽的发明和安排带来了巨大的希望。然而,需要合适的实验办法来以高通量和低利润考证候选物。
马克斯·普朗克陆地微生物研讨所(Max Planck Institute for Terrestrial Microbiology)的研讨团队建立了无细胞蛋白质分解(CFPS)管线,用于直接从 DNA 模板快速、廉价地消费抗菌肽 (AMP)。为了考证该平台,研讨人员运用深度进修重新安排了数千个 AMP。
运用计算办法,研讨人员对运用 CFPS 管线生成和挑选的 500 个候选物进行了优先排序。该团队鉴定了 30 种功能性 AMP,并通过分子动力学模拟、抗菌活性和毒性对其进行了进一步表征。
值得注意的是,六种 de novo-AMP 具有针对多重耐药病原体的广谱活性,并且不会产生细菌耐药性。该工作证明了 CFPS 在 24 小时内高通量、低利润消费和测试生物活性肽的后劲。
该研讨以「Cell-free biosynthesis combined with deep learning accelerates de novo-development of antimicrobial peptides」为题,于 2023 年 11 月 8 日发布在《Nature Communications》。
据世界卫生组织称,抗菌素耐药性(AMR)是全球十大健康威胁之一。仅2019年,致病性大肠杆菌、ESKAPE病原体(屎肠球菌、金黄色葡萄球菌、肺炎克雷伯菌、鲍曼不动杆菌、铜绿假单胞菌、肠杆菌)、肺炎链球菌、结核杆菌等多重耐药菌就造成 127 万人死亡。
预计到 2050 年,这一数字每年将达到 1000 万。尽管威胁迫在眉睫,但新型抗菌药物的开发仍然落后。2021 年,虽然有超过 4000 种免疫肿瘤化合物进入临床试验,但只有 40 种抗菌药物接受了临床研讨(其中没有一种对多重耐药革兰氏阴性菌有活性),这表明迫切需要增加新型抗菌化合物的开发。
一类有前景的抗菌化合物是抗菌肽(AMP)。一大类 AMP 含有 12-50 个典型氨基酸 (AA) 的线性肽,它们已成为自然界细菌抗菌库以及多细胞生物先天免疫系统的一部分。
与经典抗生素相比,AMP 的耐药性发展减少,主要是因为(i)大多数 AMP 直接作用于细胞膜,(ii)显示相对较高的杀伤率,(iii),对 AMP 的抗性是由相当非特异性的机制赋予的,这减少了突变或水平基因转移事件的机会。总体而言,这使得 AMP 成为下一代抗菌药物的重要候选者。
迄今为止,科学家已对约 5000 种 AMP 进行了表征,其中大部分是天然来源的。然而,这 5000 个 AMP 仅涵盖了大自然大概探索的大概解决方案空间的一小部分(30 个 AA AMP 约为 2030 个)。此外,从基因组和宏基因组中进行 AMP 挖掘受到有限的天然(尚未发明)AMP 以及可用的计算和实验 AMP 挖掘工具的阻碍。因此,科学家从这片未知领域发明新的 AMP 的能力是有限的。
由于随机生成的肽不太大概表现出抗菌特性,因此无限开发 AMP 的一种办法是运用深度进修模型,该模型越来越多地用于重新蛋白质和肽安排。在这种称为生成深度进修的办法中,模型运用未标记的数据来进修训练集中的自然蛋白质序列景观,以提出新的自然蛋白质序列。
这些模型与运用标记数据从蛋白质序列预测蛋白质特定属性(标签)的预测模型不同。生成和预测深度进修最近已用于发明新的 AMP 序列,随后通过单个候选物的化学分解来创建和考证这些序列。虽然这一原理考证展示了深度进修在 AMP 发明中的后劲,但由于缺乏中高通量消费和挑选更多 AMP 候选物的便捷办法,该办法的更广泛应用受到限制。
提高 AMP 消费通量的一种大概性是从化学分解转向基于 DNA 的生物消费办法。然而,在大肠杆菌等微生物中异源表达 AMP 有几个缺点:(i) 它是时间和劳动力密集型的;(ii) 它需要从细胞培养物中克隆、消费和纯化 AMP,最重要的是;(iii) 许多(有效的)AMP 候选物大概不可用,因为它们大概在诱导后杀死消费菌株。
无细胞蛋白质分解(CFPS)为这些挑战提供了一个有前途的解决方案。CFPS 系统是体外转录翻译 (TX-TL) 系统,直接运用 DNA 模板进行蛋白质生物分解,从而可以在活细胞外消费肽。因此,这些系统可以帮助克服潜在的细胞毒性效应,并为从线性 DNA 中快速、小规模平行消费数百种肽开辟道路。
「在深度进修中,神经网络——受人脑启发的算法——从大量数据中进修。这种类型的机器进修对于肽发明和重新安排具有巨大的前景。然而,通常随后会进行肽的化学分解以进行实验考证,这相当困难且耗时,并且严重限制了可以化学分解的肽的数量。」马克斯·普朗克陆地微生物研讨所的 Amir Pandi 解释道。
图:通过深度进修和无细胞生物分解重新开发 AMP 的工作流程。(来源:论文)
在这里,马克斯·普朗克陆地微生物研讨所 Amir Pandi 所在的团队将深度进修和 CFPS 结合起来,进行重新安排,在 24 小时内快速消费和小规模挑选 AMP,每个单独的 AMP 消费检测利润低于 10 美元(不包括 DNA 片段的利润)。
在探索了约 500,000 个理论序列后,研讨人员挑选了 500 个 AMP 候选物,鉴定出 30 个功能性 AMP,它们与任何天然序列完全无关。值得注意的是,其中六种 AMP 对多重耐药病原体表现出高抗菌活性,没有出现耐药性,对人体细胞只有极小的毒性。
虽然在该研讨中,研讨人员运用 CFPS 管线来分解含有天然氨基酸的线性肽,但未来可以利用的 CFPS 的独特优势是可以分解含有环和非规范氨基酸的肽。不过,目前的 CFPS 在表达具有难以分解基序的肽时大概面临困难。
此外,肽的表达性和结构以及与 PURE 成分大概的相互作用大概会导致假阴性结果。幸运的是,CFPS 的吞吐量通过挑选大量候选人来弥补这种情况。请注意,肽序列越长(抗菌特异性越高),化学分解就越困难,CFPS 工作就越困难。此外,该 CFPS 管线可应用于大分子蛋白质。
与其他办法相比,研讨人员在寻找功能性 AMP 方面的成功率处于相同范围内,所有测试候选物的成功率为 6%(该团队的最佳生成器-回归器组合为 12.6%),而 Das 团队报告的成功率为 10%。然而,发明的功能性 AMP 总数要高出一个数量级(30 个 AMP 对 2 个),并且速度大幅增加(24 小时对 28 天)且利润相当低(消费一种 AMP 用于并行挑选两种菌株的利润<10 美元,不包括不断降低的 DNA 分解或运用 PCR 引物的利润)。虽然深度进修模型可以提高未来工作的命中率,但像该团队这样的高吞吐量办法可以实现更高的命中率。此外,CFPS 系统的内部制备可以将肽消费利润降低至约 1 美元。
该团队的 de novo AMP 虽然独特且多样化,但与已知的 AMP 具有共同的特性。预计它们主要是富含阳离子和疏水性氨基酸的 α-螺旋肽,并且优选作用于带负电的 IM,这表明该管线能够安排遵循 AMP 一般构建原则的新颖序列。由此产生的 AMP 具有几个特征(经过体内考证)大概有助于其成功转化为治疗应用,包括广谱活性、细菌耐药性发展倾向低、局部或全身运用的后劲以及与现有疗法的协同后劲。
尽管该团队的主要重点是寻找具有广谱活性的 AMP,但该管线与各种机器进修技术相结合,也非常适合具有更具体特征的 AMP 的开发和迭代优化。这些特征大概包括选择性和特异性、稳定性、体内生物利用度、免疫调节特性、与现有药物的协同作用以及耐药性。通过完善这些功能,该管线有后劲推进各种临床应用的 AMP 安排。
总的来说,该团队的工作提供了原理考证,说明如何运用 CFPS 来充分发挥未来机器进修办法的后劲。特别是考虑到 DNA 分解利润不断降低,深度进修和 CFPS 相结合的办法为肽消费和挑选提供了一种时间、利润和劳动力有效的办法。因此,该工作有大概以更高的速度和深度探索 AMP 的安排功能空间。这有望在未来促进基于肽的候选药物的发明和开发。
「我们从无细胞分解生物学、人工智能和高通量办法的结合中获益匪浅。通过增加可在 24 小时内进行实验测试的候选物数量,发明活性抗菌肽的机会增加了。」Pandi 说,「因此,我们的无细胞蛋白质分解管道不仅补充了计算安排的最新进展。它还有后劲更快、更经济地探索生物活性肽的安排和功能之间的关系。」
该团队的负责人之一 Tobias Erb 补充道:「这种分解生物学和机器进修相结合的新办法将会引起生物医学和生物活性肽领域科学家的兴趣。」
论文链接:https://www.nature.com/articles/s41467-023-42434-9
相关报道:https://phys.org/news/2023-11-method-combines-synthetic-biology-ai.html