人工智能工具帮助科学家预测病毒进化

新冠肺炎凸显了在有效预测和应对新发传染病方面的重大差距。 疫情的毁灭性影响是一个持久的提醒。 虽然我们摆脱了新冠肺炎,其他病毒或新突变仍可能构成威胁。

新冠肺炎凸显了在有效预测和应对新发传染病方面的重大差距。疫情的毁灭性影响是一个持久的提醒。虽然我们摆脱了新冠肺炎,其他病毒或新突变仍可能构成威胁。

人工智能工具帮助科学家预测病毒进化

随着病毒爆发能够以前所未有的速度出现和发展,全球卫生界面临着保持领先地位的持续挑战。风险很高,因为预测病毒突变和准备有效对策的能力可能意味着遏制和灾难之间的区别。

如今我们有了一个强大的新盟友——人工智能(AI)。但是人工智能能帮助预测下一次疫情吗?它能帮助我们更好地应对病毒爆发吗?

虽然研究人员可能还无法仅通过观察新病毒的基因序列来预测其进化方式,从而实现大流行防范,但人工智能可以帮助我们预测现有病毒如严重急性呼吸系统综合征冠状病毒2型和流感病毒的进化方式。

这些病毒,特别是RNA病毒,经常发生突变,有时会使它们逃避宿主免疫并更快地传播。预测病毒的进化变化可以使研究人员提前开发疫苗和抗病毒治疗方法。

HMS Blavatnik研究所系统生物学教授Debora Marks说:“我们想知道是否可以预测病毒的变异并预测新的变异,因为如果可以的话,这对设计疫苗和疗法将极其重要。”

目前,人工智能可以成功预测单个短期突变,但它还不能预测未来可能发生的突变组合。基于人工智能的蛋白质结构预测工具的出现,如DeepMind的AlphaFold和Meta的ESMFold,为我们预测病毒进化的能力提供了巨大的潜力。

哈佛医学院和牛津大学的研究人员开发了基于人工智能的EVEscape工具,用于预测病毒如何变异以逃避免疫系统。它结合了进化序列,显示了类似病毒在过去是如何进化的,以及关于当前病毒的生物和结构信息。该工具已被证明在预测新冠肺炎大流行期间的重大突变方面有效,目前正用于预测SARS-CoV-2和其他病毒的未来变异。

联合首席研究员Nicole Thadani解释说:“我们正在获取有关免疫系统如何工作的生物信息,并将其与我们从更广泛的病毒进化史中获得的知识相结合。”

这些人工智能模型分析大量数据来预测蛋白质将如何折叠和相互作用,帮助科学家预测潜在的突变及其影响。虽然这些工具还不完美,但它们是我们对抗不断进化的病毒的重要一步。

令人鼓舞的是,有大量数据可用于训练这些模型,研究人员有近1700万个序列可用于训练他们的模型。当然,我们需要更多高质量的数据来提高人工智能模型的准确性。

用于预测病毒进化的人工智能模型有一个明显的局限性。虽然他们可以预测病毒基因组微小变化的影响,但他们很难预测突然的重大进化飞跃,例如严重急性呼吸系统综合征冠状病毒2型的奥密克戎变异株,该变异株有50多个突变。随着数据的增加,我们可能需要更复杂的人工智能模型来预测所有形式的病毒进化。

格拉斯哥大学的病毒学家David Robertson和他的团队正在完善人工智能模型,以理解这些巨大的进化飞跃及其局限性。他们的目标是在早期迅速识别病毒的突变能力及其适应性,帮助更有效地预测和管理未来的威胁。

科学界正在以各种方式使用人工智能工具来解决病毒进化和流行病防范问题。从预测潜在的新变种到了解这些变化如何影响公共卫生,人工智能的作用比以往任何时候都更加重要。

相关资讯

病毒从何而来?AlphaFold等AI正在寻找答案

图示:登革热病毒蛋白的结构。(来源:Spyros Lytras 和 Joe Grove)编译 | 白菜叶人工智能 (AI) 正在帮助重新绘制病毒家族树。AlphaFold 生成的预测蛋白质结构和受聊天机器人启发的「蛋白质语言模型」揭示了病毒家族中的一些令人惊讶的联系,其中包括感染人类的病原体以及新出现的威胁。科学家对病毒进化的理解大多基于基因组比较。但病毒(尤其是那些基因组以 RNA 编写的病毒)的闪电般快速进化以及它们从其他生物体获取遗传物质的倾向意味着基因序列可以隐藏病毒之间深远的关系,而这种关系也可能因所检查

中国科学家运用人工智能算法发现大量全新 RNA 病毒,大幅拓宽 RNA 病毒库

AI在线从中山大学官方微信公众号获悉,10 月 9 日,中山大学医学院施莽教授团队与阿里云李兆融团队在《细胞》(Cell)杂志上发表论文,报告了 180 个超群、超过 16 万种全球 RNA 病毒的发现,这是迄今为止规模最大的 RNA 病毒研究,大幅扩展了全球 RNA 病毒的多样性,该研究将人工智能技术应用于病毒鉴定,发现了传统方法未能发现的病毒“暗物质”,探索了病毒学研究的新路径。据介绍,传统的病毒发现方法包括病毒分离和生命组学的生物信息学分析,高度依赖既有知识,面对 RNA 病毒这种高度分化、种类繁多且容易变异

AI发现超16万种新RNA病毒?阿里云、中山大学合作研究登Cell

编辑 | 萝卜皮人工智能(AI)已被用来揭示地球各个角落的多种基本生命体。阿里云、中山大学、悉尼大学等机构的合作团队开发了一种深度学习算法,称为 LucaProt,用于发现来自全球不同生态系统的 10,487 个宏转录组中高度分化的 RNA 依赖性 RNA 聚合酶 (RdRP) 序列。LucaProt 整合了序列和预测结构信息,从而能够准确检测 RdRP 序列。