Nature | 通过序列聚类和 AlphaFold2 预测多种构象

编辑 | XAlphaFold2 (AF2) 通过准确预测蛋白质的单一结构彻底改变了结构生物学。然而,蛋白质的生物学功能通常取决于多种构象亚状态,而致病的点突变往往会导致这些亚状态内的种群变化。来自布兰迪斯大学和霍华德·休斯医学研究所(Brandeis University and Howard Hughes Medical Institute)、哈佛大学和剑桥大学的研究团队,研究证明通过序列相似性对多序列比对 (MSA) 进行聚类,使 AF2 能够以高置信度对已知变形蛋白(metamorphic protein)

图片

编辑 | X

AlphaFold2 (AF2) 通过准确预测蛋白质的单一结构彻底改变了结构生物学。然而,蛋白质的生物学功能通常取决于多种构象亚状态,而致病的点突变往往会导致这些亚状态内的种群变化。

来自布兰迪斯大学和霍华德·休斯医学研究所(Brandeis University and Howard Hughes Medical Institute)、哈佛大学和剑桥大学的研究团队,研究证明通过序列相似性对多序列比对 (MSA) 进行聚类,使 AF2 能够以高置信度对已知变形蛋白(metamorphic protein)的交替状态进行采样。使用 AF-Cluster 方法,研究人员研究了变形蛋白 KaiB5 的预测结构的进化分布,发现两种构象的预测都分布在 KaiB 家族的簇中。

研究人员使用核磁共振 (NMR) 光谱来证实一个令人惊讶的 AF-Cluster 预测:蓝藻 KaiB 变体稳定在与更广泛研究的变体相反的状态。

为了测试 AF-Cluster 对点突变的敏感性,设计并通过实验验证了一组 3 个突变,预计会将球形红杆菌的 KaiB 从基础状态翻转到折叠转换状态(from the ground to the fold-switched state)。最后,在没有已知折叠转换的蛋白质家族中筛选替代状态,确定了结核分枝杆菌中氧化还原酶 Mpt53 的假定替代状态。这种生物信息学方法与实验的进一步发展可能会对预测蛋白质能量景观产生深远影响,这对于阐明生物功能至关重要。

该研究以《Predicting multiple conformations via sequence clustering and AlphaFold2》为题,于 2023 年 11 月 13 日发布在《Nature》上。

图片

论文链接:https://www.nature.com/articles/s41586-023-06832-9

要了解蛋白质功能的机制基础,就需要了解它可能采用的完整的构象亚态。对于任何蛋白质结构预测方法,预测集合(ensemble)的任务可以分为两部分:理想的方法将(1)生成包含完整景观的构象,以及(2)根据基础玻尔兹曼分布对这些构象进行评分。

AlphaFold2 (AF2) 在 CASP14 竞赛中取得突破性表现,部分原因在于推进了推断 MSA 中相关序列之间相互作用模式的最先进技术,这建立在推断这些模式(通常称为进化耦合)的方法基础上。基于进化耦合的结构推断方法的前提是,由于氨基酸在 3D 结构的背景下存在和进化,它们不能自由地独立进化,而是以反映基础结构的模式共同进化。然而,蛋白质必须在它们采用的多种构象状态的背景下进化。

AF2 在单结构预测方面前所未有的准确性,引起了人们对其预测蛋白质多种构象的能力的兴趣,但 AF2 已被证明无法使用其默认设置来预测变形蛋白、具有 apo/holo 构象变化的蛋白质以及其他多状态蛋白质的多种结构。

为什么对 MSA 进行二次采样会预测多种构象状态?这种方法在给定系统中的成功意味着,当使用完整的 MSA 计算进化耦合时,多个状态的进化耦合已经充分存在,因此当 MSA 进行子采样时,引入的噪声会掩盖这些接触的子集,仍然有足够完整的接触集对应于一个或另一个状态。

假设变形蛋白将是一组有用的模型蛋白,可用于开发预测构象整体的方法,因为它们会经历特别显著的构象变化。例如,虽然变形蛋白 KaiB 仅包含 108 个残基,但它会发生构象变化,影响其 C 端部分大约 40 个残基的二级结构,在典型的硫氧还蛋白样结构和独特的替代构象之间切换。不到 10 个变形蛋白家族经过彻底的实验表征,它们具有多种功能。蛋白质中的折叠转换控制转录调节(大肠杆菌中的 RfaH)、昼夜节律(蓝细菌中的 KaiB)、酶活性(M.janaschii 中的选择酶金属肽酶)、细胞信号传导(人类中的趋化因子淋巴趋化素)和细胞循环检查点(人类中的 Mad2)。

对 PDB 的计算分析确定了共享相同序列的蛋白质模型之间二级结构的变化,表明所有蛋白质中有 0.5-4% 是折叠转换的。开发识别折叠转换蛋白的系统方法将有助于识别新的折叠转换蛋白,突出新的结构和相互作用以用于治疗,并阐明已知和潜在的蛋白质结构、功能和进化历史的更广泛原理。这些原理是已知和尚未发现的变形蛋白的基础。

假设,如果能够在不添加先验知识的情况下对进化耦合集进行反卷积,并将这些集单独输入到 AF2 中,AF2 可能能够以高结构精度预测多种构象。研究人员证明了一种简单的 MSA 子采样方法(通过序列相似性对序列进行聚类)允许 AF2 预测变形蛋白 KaiB、RfaH 和 Mad2 的两种状态。

重要的是,研究表明,使用新方法「AF-Cluster」,通过 AF2 学习的预测局部距离差异测试 (plDDT) 测量,可以对两种状态进行高置信度采样和评分。研究确定了 AF-Cluster 预测多个状态的原因:通过对精心策划的系统发育树中的 KaiB 变体进行 AF-Cluster 预测,发现预测折叠到一个或另一个子状态的 KaiB 变体在整个系统发育树中分布在簇中。

研究人员认为非常有必要对 Thermosynechococcus elongatus pestitus 中的一种新 KaiB 变体进行实验测试 AF-Cluster 预测,该变体被预测为有利于折叠转换 (FS) 状态。使用 NMR,可以验证 AF-Cluster 预测。为了测试 AF-Cluster 预测点突变对蛋白质构象平衡切换的影响的能力,研究人员预测并验证了一组最小的点突变,这些点突变将来自球形红杆菌的 KaiB 在基态和 FS 状态之间切换。

图片

图示:AF-Cluster 预测蛋白质 RfaH 和 Mad2 的折叠转换。(来源:论文)

在对已知变形蛋白评估 AF-Cluster 方法后,研究人员接下来假设该方法可能能够检测未知结构的蛋白质家族中的替代构象。将 AF-Cluster 应用于与晶体结构相关的现有 MSA 数据库。在这里描述了筛选出的一个候选者具有一种新的预测交替折叠,即结核分枝杆菌分泌的氧化还原酶 Mpt53。结果表明,在即将到来的 AF2 结构生物学时代,任何给定蛋白质靶点的相关序列可能包含多个生物学相关结构的信号,并且深度学习方法可用于检测和分析这些多种构象状态。

相关资讯

准确预测蛋白质「运动」?AlphaFold融合物理知识,南京大学团队蛋白构象运动新策略

编辑 | KX蛋白质如何进行构象运动,不仅是一个基本的生物物理问题,而且对于药物设计等实际应用也至关重要。尽管深度学习方法,比如 AlphaFold2 和 RoseTTAFold,可以高通量预测蛋白质的静态结构,但预测构象运动仍然是一个挑战。在此,南京大学、香港浸会大学(Hong Kong Baptist University)、中国科学院大学以及昌平实验室和莱斯大学合作,找到了一种新的方法来预测蛋白质在发挥作用时如何改变形状,这对于了解它们在生物系统中的工作方式非常重要。研究人员提出了一种解决构象运动的策略,即将

科学家用分子动力学和AlphaFold,揭示了转运蛋白的未解结构

编辑 | 萝卜皮转运蛋白改变其构象以携带其底物穿过细胞膜。构象动力学对于理解运输功能至关重要。日本国立自然科学研究院(National Institutes of Natural Sciences)和冈山大学(Okayama University)的合作团队研究了草酸转运蛋白(OxlT),这是一种来自产酸草酸杆菌的草酸:甲酸逆向转运蛋白,对于避免肾结石形成具有重要意义。OxlT 的原子结构最近已在向外开放和封闭状态下得到解决。然而,向内开放的构象仍然缺失,阻碍了研究人员对转运蛋白的完整理解。在最新的研究中,该团队进

高精度预测蛋白构象变化,中国科大、上科大通用深度学习模型

编辑 | KX预测蛋白质构象变化是计算生物学和人工智能领域的一大挑战。 主流的 AlphaFold 等算法可以高通量预测蛋白质的静态结构,但对蛋白质构象变化预测却束手无策。 为了解决这个问题,中国科学技术大学和上海科技大学的研究人员,提出了一种新颖的深度学习策略,即利用高通量生物物理采样来规避与蛋白质构象转变相关的数据匮乏。