编辑 | KX
蛋白质如何进行构象运动,不仅是一个基本的生物物理问题,而且对于药物设计等实际应用也至关重要。尽管深度学习方法,比如 AlphaFold2 和 RoseTTAFold,可以高通量预测蛋白质的静态结构,但预测构象运动仍然是一个挑战。
在此,南京大学、香港浸会大学(Hong Kong Baptist University)、中国科学院大学以及昌平实验室和莱斯大学合作,找到了一种新的方法来预测蛋白质在发挥作用时如何改变形状,这对于了解它们在生物系统中的工作方式非常重要。
研究人员提出了一种解决构象运动的策略,即将 AF2 的预测能力与蛋白质构象运动的能量景观分析相结合。研究表明,局部能量挫折(量化变构蛋白质的能量景观特征)可用于增强 AlphaFold2 预测蛋白质构象运动的能力。
「从预测的静态基态结构开始,新方法通过首先发现,然后逐步增强编码蛋白质进化发展的输入多序列比对序列中的能量挫折特征,从而为蛋白质运动产生替代结构和途径。」共同通讯作者、莱斯大学的 Peter Wolynes 教授说。
此外,还研究了 AF2 的工作原理,表明将能量景观的物理知识与 AI 相结合,不仅有助于预测蛋白质的运动方式,而且还解释了为什么 AI 会过度预测结构完整性,从而只产生最稳定的结构。
相关研究以「Predicting protein conformational motions using energetic frustration analysis and AlphaFold2」为题,发布在《PNAS》上。
论文链接:https://www.pnas.org/doi/10.1073/pnas.2410662121
蛋白质的大规模构象运动对许多生物过程至关重要,例如催化、信号转导和运输。天然蛋白质的序列已经进化形成独特的能量景观,这不仅决定了相应的三维天然结构,还决定了它们与功能相关的运动。
AlphaFold2 (AF2) 和 RoseTTAFold 成功地直接从序列生成结构,正是通过利用进化数据才得以实现。
能量景观理论表明,虽然进化塑造了蛋白质的能量景观,使它们可以折叠成最佳结构,但偏离原本引导折叠的完美漏斗景观,即局部挫折,对于蛋白质的功能运动至关重要。
AF2 和 RoseTTAFold 在直接生成蛋白质三维结构方面取得的巨大成功启发我们思考:是否有可能将这种数据驱动的方法与现有的关于能量景观的物理思想相结合,从而直接预测大规模蛋白质构象运动,而无需进行分子动力学模拟?
基于此,南京大学研究团队利用 AF2 使用 MSA 进化数据的能力,提出了一种将 AF2 的结构预测能力与蛋白质能量挫折分析相结合以预测蛋白质构象运动的方法。
图示:AF2 预测蛋白质动力学的物理规律示意图。(来源:论文)
挫折概念强调了冲突相互作用在蛋白质折叠、动力学和功能中的作用,为解锁 AF2 的这种更深层功能提供了关键。通过利用基于现有生物物理工具提取的变构蛋白的可用能量挫折模式,研究人员旨在将 AF2 的功能扩展到静态结构预测之外,包括变构蛋白的动力学,从而提高科学家对基因型-表型映射的理解。
这种结合 AF2 和生物物理规则的计算方法,将有助于深入研究蛋白质动力学。
腺苷酸激酶 (AdK) 是一种多结构域蛋白,由 LID 结构域、NMP 结构域和核心结构域组成,已成为研究变构的典型系统。
在该研究中,同样以 AdK 为模型,展示如何利用由局部能量挫折分数量化的能量景观局部特征,预测 AF2 的蛋白质构象运动。
研究发现生成的构象运动与可用的实验和分子动力学模拟数据一致。
图示:AdK 的局部能量挫折。(来源:论文)
将该方法应用于另外两种涉及大幅度构象变化的蛋白质 KaiB 和核糖结合蛋白,也可以成功生成替代构象。
图示:使用挫折过滤策略预测 KaiB 的替代结构。(来源:论文)
能量景观理论是这种方法的关键部分,但目前的大部分 AI 模型被训练成只会预测蛋白质的最稳定结构,而忽略了蛋白质在发挥作用时可能呈现的不同形状。
通过精确定位受挫区域,研究人员教会了 AI 在指导其预测时忽略这些区域,从而使代码能够准确预测替代蛋白质结构和功能运动。
研究人员使用在能量景观框架内开发的挫折分析工具,确定了蛋白质中受挫,且因此具有灵活性的区域。
然后,通过操纵 AlphaFold 使用的对齐蛋白质家族序列中的进化信息,并根据挫折分数,研究人员教会 AI 识别这些受挫区域,从而能够准确预测它们之间的替代结构和途径,Wolynes 说。
「在后 AlphaFold 时代,不要忘记或放弃基于物理的方法的重要性,在这个时代,重点是从实验数据中进行不可知论学习,而无需任何理论输入,」Wolynes 说。「将 AI 与生物物理学相结合,将对未来的实际应用产生重大影响,包括药物设计、酶工程和理解疾病机制。」
参考内容:https://phys.org/news/2024-08-artificial-intelligence-frustration-protein.html