更高准确性,覆盖蛋白、核酸、复合物等更多份子,DeepMind发布AlphaFold新版本

编辑 | ScienceAI自 2020 年发布以来,AlphaFold 彻底改变了人们对蛋白质及其相互作用的了解方式。Google DeepMind 和 Isomorphic Labs 一直在共同努力,为更强大的 AI 模型奠定基础,将覆盖范围从蛋白质扩张到全方位的生物相关份子。2023 年 10 月 31 日,该钻研团队分享了下一代 AlphaFold 的最新进展。其最新的模型现在可以对蛋白质数据库 (PDB) 中的几乎所有份子进行预计,通常达到原子精度。新版模型 AlphaFold-latest (暂称)极大

更高准确性,覆盖蛋白、核酸、复合物等更多份子,DeepMind发布AlphaFold新版本

编辑 | ScienceAI

自 2020 年发布以来,AlphaFold 彻底改变了人们对蛋白质及其相互作用的了解方式。Google DeepMind 和 Isomorphic Labs 一直在共同努力,为更强大的 AI 模型奠定基础,将覆盖范围从蛋白质扩张到全方位的生物相关份子。

2023 年 10 月 31 日,该钻研团队分享了下一代 AlphaFold 的最新进展。其最新的模型现在可以对蛋白质数据库 (PDB) 中的几乎所有份子进行预计,通常达到原子精度。

新版模型 AlphaFold-latest (暂称)极大地扩张了应用范围,能够预计包括蛋白质、核酸、小份子、离子和润色残基在内的复合物的联合布局。这些不同的布局类型和复合物对于了解细胞内的生物机制至关重要。

在大多数情况下, AlphaFold-latest 比以前的专业工具大大提高了准确性:蛋白质-配体相互作用的准确性优于最先进的连接工具,蛋白质-核酸相互作用的准确性优于 RoseTTA2FoldNA 等专业预计模型,抗体-抗原预计准确性比 AlphaFold-Multimer 显著提高。

该模型扩张的功能和本能有助于加速生物医学突破并实现「数字生物学」的下一个时代——为疾病途径、基因组学、生物可再生材料、植物免疫、潜在医治靶点、药物设计机制以及实现蛋白质工程和合成生物学的新平台的功能提供新的见解。

超越蛋白质折叠

AlphaFold 是单链蛋白预计的根本性突破。AlphaFold-Multimer 随后扩张到具有多个蛋白质链的复合物,随后是AlphaFold2.3,它提高了本能并将覆盖范围扩大到更大的复合物。

2022 年,AlphaFold 与 EMBL 的欧洲生物信息学钻研所(EMBL-EBI)合作,通过 AlphaFold 蛋白质布局数据库免费提供了几乎所有科学界已知的已编目蛋白质的布局预计。

迄今为止,已有 190 多个国家的 140 万用户访问了 AlphaFold 数据库,世界各地的科学家已经使用 AlphaFold 的预计来帮助推进各种钻研,从加速新的疟疾疫苗和推进癌症药物的发现,到开发用于解决污染的塑料食用酶。

在这里,钻研人员展示了 AlphaFold-latest 在预计蛋白质折叠之外的精确布局方面的卓越能力,可以在配体、蛋白质、核酸和翻译后润色之间产生高精度的布局预计。

更高准确性,覆盖蛋白、核酸、复合物等更多份子,DeepMind发布AlphaFold新版本

图:AlphaFold 最新功能和本能;蛋白质-配体复合物 (a)、蛋白质 (b)、核酸 (c) 和共价润色 (d) 的本能。(来源:论文)

AlphaFold-latest 将生物组装的描述作为输出,其中包含聚合物序列和配体 SMILES,以及可选的共价键合配体的序列位子,并输出每一个重原子 3D 位子的预计。水和氢被排除在外。用于训练模型的所有实验布局均来自 PDB,发布日期截至 2021 年 9 月 30 日。模板仅过滤为 2021 年 9 月 30 日之前发布的模板。

输出被「标记化」以获得模型输出,每一个标准聚合物残基有一个标记,配体和非标准聚合物残基的每一个重原子有一个标记。Token 的数量是不同硬件上计算时间和预计大小限制的主要驱动因素。为了便于计算,该团队在最多 5,120 个 token 的复合体上评估零碎本能,但零碎能够在具有大量内存的加速器上运行更大的复合体。

每一个输出布局都带有每一个原子、每一个 token 对和聚合布局级置信度度量。此外,布局内的每一个实体以及布局内实体之间的每一个接口都具有关联的置信度度量。

在这里,钻研人员主要展示了四个类别的本能:

(1)尽管基线使用真实联合蛋白质布局作为输出,但 AlphaFold-latest 在 PoseBusters 配体连接基准上优于 AutoDock Vina 等经典零碎,而 AlphaFold-latest 仅从蛋白质序列和配体身份开始。

(2)它在蛋白质-蛋白质布局预计方面改进了 AlphaFold 2.3,特别是在某些类别(例如抗体联合布局)中。

(3)在蛋白质-核酸界面上,AlphaFold-latest 优于竞争零碎,而对于 RNA 布局预计,它优于自动化方法,但略低于使用手动专家干预的顶级 CASP15 参赛者 (AIchemy_RNA2)。

(4)AlphaFold-latest 能够预计其他实体的布局,如键合配体、糖基化和润色的残基或核苷酸。

更高准确性,覆盖蛋白、核酸、复合物等更多份子,DeepMind发布AlphaFold新版本

图:来自 AlphaFold 最新的布局预计。(来源:论文)

加速药物发现

早期分析还表明,AlphaFold-latest 模型在一些与药物发现相关的蛋白质布局预计问题(如抗体联合)上大大优于AlphaFold2.3。此外,准确预计蛋白质配体布局是一种非常有价值的药物发现工具,因为它可以帮助科学家识别和设计可能成为药物的新份子。

目前的行业标准是使用「连接方法」来确定配体和蛋白质之间的相互作用。这些连接方法需要一个严格的参考蛋白布局和配体联合的建议位子。

AlphaFold-latest通过优于报道的最佳连接方法,为蛋白质-配体布局预计设定了新的标准,而不需要参考蛋白质布局或配体口袋的位子-允许预计以前未被布局表征的全新蛋白质。

它还可以联合模拟所有原子的位子,使其能够代表蛋白质和核酸与其他份子相互作用时的全部固有灵活性-这是使用连接方法无法实现的。

例如,以下是最近发表的三个与医治相关的病例,AlphaFold-latest 预计的布局(以彩色表示)与实验确定的布局(用灰色表示)非常吻合:

PORCN::一种临床阶段的抗癌份子,与另一种蛋白质联合在一起。

KRAS:具有重要癌症靶点共价配体(一种份子胶)的三元配合物。

PI5P4Kγ:脂质激酶的选择性变构抑制剂,与多种疾病相关,包括癌症和免疫疾病。

更高准确性,覆盖蛋白、核酸、复合物等更多份子,DeepMind发布AlphaFold新版本

图:案例钻研展示了 AlphaFold-latest 在医治相关布局上的本能;PORCN (a)、KRAS (d) 和 PI5P4Kγ (e)。(来源:论文)

Isomorphic Labs 正在将新一代 AlphaFold 模型应用于医治药物设计,帮助快速准确地表征许多类型的大份子布局,这些大份子布局对医治疾病很重要。

对生物学的新认识

通过解锁蛋白质和配体布局以及核酸和含有翻译后润色的布局的建模,AlphaFold-latest 为检查基础生物学提供了更快速和准确的工具。

其中一个例子涉及到 CasLambda 与 crRNA 和 DNA 联合的布局,这是 CRISPR 家族的一部分。CasLambda 具有 CRISPR-Cas9 零碎的基因组编辑能力,通常被称为「基因剪刀」,钻研人员可以用它来改变动物、植物和微生物的DNA。CasLambda 更小的体积可以更有效地用于基因组编辑。

更高准确性,覆盖蛋白、核酸、复合物等更多份子,DeepMind发布AlphaFold新版本

图:AlphaFold-latest 预计的核酸-蛋白复合体布局。(来源:论文)

AlphaFold 的最新版本能够模拟如此复杂的零碎,这表明人工智能可以帮助我们更好地了解这些类型的机制,并加速它们在医治应用中的应用。

推进科学探索

AlphaFold-latest 在本能上的巨大飞跃表明,人工智能有潜力极大地增强对构成人体的份子机器的科学了解——以及更广阔的自然世界。

虽然该钻研仍在积极开发中,但谷歌 DeepMind 和 Isomorphic Labs 的钻研人员相信,一般生物份子的计算布局预计可以通过 AlphaFold 等机器学习模型来实现,并为了解生物学开辟了许多令人兴奋的未来钻研途径。

论文链接:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/a-glimpse-of-the-next-generation-of-alphafold/alphafold_latest_oct2023.pdf

相关报道:https://deepmind.google/discover/blog/a-glimpse-of-the-next-generation-of-alphafold/?continueFlag=67dc1e0d8f45af09eec4ca511a2dcc9b

给TA打赏
共{{data.count}}人
人已打赏
工程

GPT-4写代码,DALL·E 3+MJ搞定画面,AI版「愤恨的南瓜」来袭

2023-11-1 14:51:00

工程

支持二次编辑、导入虚拟引擎5,Stable Diffusion进化出3D生成功能

2023-11-2 14:38:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索