效果超AlphaFold系列,量子计算方法用于蛋白质结构预测

编辑 | 白菜叶虽然 AlphaFold 等深度学习方法在计算机蛋白质结构预测领域取得了不错的成绩,但该领域的研究仍然是生物医学研究中一个具有挑战性的问题。随着量子计算的快速发展,人们自然会问:量子计算机是否能为解决这一问题提供一些帮助。然而,确定适合量子优势的特定问题实例,以及评估所需的量子资源同样具有挑战性。在这里,克利夫兰诊所(Cleveland Clinic)和 IBM Quantum 的研究人员分享了他们的观点,即如何创建一个框架来系统地选择适合量子优势的蛋白质结构预测问题,并在实用级量子计算机上估计此类

图片

编辑 | 白菜叶

虽然 AlphaFold 等深度学习方法在计算机蛋白质结构预测领域取得了不错的成绩,但该领域的研究仍然是生物医学研究中一个具有挑战性的问题。

随着量子计算的快速发展,人们自然会问:量子计算机是否能为解决这一问题提供一些帮助。然而,确定适合量子优势的特定问题实例,以及评估所需的量子资源同样具有挑战性。

在这里,克利夫兰诊所(Cleveland Clinic)和 IBM Quantum 的研究人员分享了他们的观点,即如何创建一个框架来系统地选择适合量子优势的蛋白质结构预测问题,并在实用级量子计算机上估计此类问题的量子资源。

作为概念验证,研究人员通过在量子硬件上准确预测寨卡病毒 NS3 解旋酶的催化环的结构,来验证他们的问题选择框架。

该研究以「A Perspective on Protein Structure Prediction Using Quantum Computers」为题,于 2024 年 5 月 30 日发布在《Journal of Chemical Theory and Computation》。

图片

几十年来,研究人员一直利用计算方法来预测蛋白质结构。蛋白质折叠成一种结构,决定了它如何发挥作用以及如何与体内其他分子结合。这些结构对人类健康和疾病有深远影响。

通过准确预测蛋白质的结构,研究人员可以更好地了解疾病如何传播,从而开发有效的治疗方法。克利夫兰诊所博士后研究员 Bryan Raubenolt 博士和 IBM 研究员 Hakan Doga 博士带领团队探索量子计算如何改进当前方法。

近年来,机器学习技术在蛋白质结构预测方面取得了重大进展。这些方法依赖于训练数据(通过实验确定的蛋白质结构的数据库)进行预测。这意味着它们受到已识别的蛋白质数量的限制。当程序/算法遇到突变的蛋白质或与训练时差异很大的蛋白质时,准确率会降低,这种情况在遗传疾病中很常见。

另一种方法是模拟蛋白质折叠的物理原理。模拟可以让研究人员观察给定蛋白质的各种可能形状,并找到最稳定的形状。最稳定的形状对于药物设计至关重要。

图片

图示:蛋白质结构预测管线概述。(来源:论文)

挑战在于,如果蛋白质尺寸超过一定值,这些模拟在传统计算机上几乎不可能实现。从某种意义上说,增加目标蛋白质的尺寸就好比增加魔方的尺寸。Raubenolt 博士说,对于含有 100 个氨基酸的小蛋白质,传统计算机需要相当于宇宙年龄的时间来详尽地搜索所有可能的结果。

为了克服这些限制,研究团队采用了量子和经典计算方法的混合方法。该框架可以让量子算法解决最先进的经典计算所面临的挑战,包括蛋白质大小、内在无序性、突变和蛋白质折叠所涉及的物理学。

图片

图示:量子-经典混合框架工作流程示意图。(来源:论文)

与最先进的经典方法相比,该框架通过在量子计算机上准确预测寨卡病毒蛋白小片段的折叠得到了验证。

图片

图示:使用寨卡病毒相关蛋白进行验证。(来源:论文)

量子-经典混合框架的初步结果优于基于经典物理的方法和 AlphaFold2。尽管后者的设计最适合处理较大的蛋白质,但它仍然证明了该框架能够在不直接依赖大量训练数据的情况下创建精确模型的能力。

研究人员首先利用量子算法来模拟片段主链的最低能量构象,这通常是计算过程中计算量最大的步骤。然后使用经典方法转换从量子计算机获得的结果,重建蛋白质及其侧链,并使用经典分子力学力场对结构进行最终细化。

图片

图示:估算所需的量子资源。(来源:论文)

该项目展示了将问题分解成各个部分的方法之一,利用量子计算方法解决其中的一些部分,利用经典计算解决其他部分,以提高准确性。

「该项目最独特的一点是涉及的学科数量。」Raubenolt 博士说,「我们团队的专业知识范围广泛,从计算生物学和化学、结构生物学、软件和自动化工程到实验原子和核物理学、数学,当然还有量子计算和算法设计。它利用各个领域的知识来创建计算框架,可以模拟人类生命中最重要的过程之一。」

该团队将经典计算方法与量子计算方法相结合,对于增进科学家对蛋白质结构的理解以及它们如何影响我们治疗和预防疾病的能力是至关重要的一步。该团队计划继续开发和优化可以预测更大、更复杂蛋白质结构的量子算法。

Doga 博士表示:「这项研究是探索量子计算能力在蛋白质结构预测中的优势的重要一步。我们的目标是设计出能够尽可能真实地预测蛋白质结构的量子算法。」

论文链接:https://pubs.acs.org/doi/10.1021/acs.jctc.4c00067

相关报道:https://phys.org/news/2024-05-quantum-methods-protein.html

相关资讯

AlphaFold 3 重磅问世,全面预测蛋白质与所有生命分子相互作用及结构,准确性远超以往水平

编辑 | 萝卜皮自 2021 年发布强大的人工智能 (AI) 工具 AlphaFold2 以来,科学家们一直在使用蛋白质结构预测模型来绘制细胞内各种蛋白质结构的图谱、发现药物,并绘制每种已知蛋白质相互作用的「宇宙图」。就在刚刚,Google DeepMind 发布了 AlphaFold3 模型,该模型能够对包括蛋白质、核酸、小分子、离子和修饰残基在内的复合物进行联合结构预测。AlphaFold3 的准确性对比过去许多专用工具(蛋白质-配体相互作用、蛋白质-核酸相互作用、抗体-抗原预测)有显著提高。这表明,在单个统一

AlphaFold 3 向解码分子行为和生物计算迈出重要一步,Nature 子刊锐评

编辑 | KX如果我们完全了解分子之间是如何相互作用的,那么生物学就没什么可学的了,因为每一种生物现象,包括我们如何感知世界,最终都源于细胞内生物分子的行为和相互作用。最近推出的 AlphaFold 3 可以直接从蛋白质、核酸及其配体的序列中预测生物分子复合物的 3D 结构。这标志着我们在长期探索生物分子如何相互作用方面取得了重大进展。AlphaFold 3 代表了直接从复合物序列预测其三维结构的突破,为生物分子相互作用提供了见解。生物分子(如蛋白质或核酸)的一维 (1D) 序列以类似于一段代码指定程序的方式指定细

预测蛋白质-DNA结合特异性,南加州大学团队开发几何深度学习新方法

编辑 | 萝卜皮预测蛋白质-DNA 结合特异性是一项具有挑战性但又至关重要的任务,有助于理解基因调控。蛋白质-DNA 复合物通常与选定的 DNA 靶位结合,而蛋白质则以不同程度的结合特异性与广泛的 DNA 序列结合。这些信息无法在单一结构中直接获取。为了获取这些信息,南加州大学(University of Southern California)和华盛顿大学(University of Washington)的研究人员提出了深度结合特异性预测器(DeepPBS),这是一种几何深度学习模型,旨在根据蛋白质-DNA 结