编辑 | 白菜叶
虽然 AlphaFold 等深度学习方式在估计机蛋白质布局预计领域取得了不错的成绩,但该领域的研讨仍然是生物医学研讨中一个具有挑战性的题目。
随着量子估计的快速发展,人们自然会问:量子估计机是否能为办理这一题目提供一些帮助。然而,确定适合量子优势的特定题目实例,以及评估所需的量子资源同样具有挑战性。
在这里,克利夫兰诊所(Cleveland Clinic)和 IBM Quantum 的研讨职员分享了他们的观点,即如何建立一个框架来系统地选择适合量子优势的蛋白质布局预计题目,并在实用级量子估计机上估计此类题目的量子资源。
作为概念考证,研讨职员通过在量子硬件上准确预计寨卡病毒 NS3 解旋酶的催化环的布局,来考证他们的题目选择框架。
该研讨以「A Perspective on Protein Structure Prediction Using Quantum Computers」为题,于 2024 年 5 月 30 日发布在《Journal of Chemical Theory and Computation》。
几十年来,研讨职员一直使用估计方式来预计蛋白质布局。蛋白质折叠成一种布局,决定了它如何发挥作用以及如何与体内其他分子结合。这些布局对人类健康和疾病有深远影响。
通过准确预计蛋白质的布局,研讨职员可以更好地了解疾病如何传播,从而开发有效的治疗方式。克利夫兰诊所博士后研讨员 Bryan Raubenolt 博士和 IBM 研讨员 Hakan Doga 博士带领团队探索量子估计如何改进当前方式。
近年来,机器学习技术在蛋白质布局预计方面取得了重大进展。这些方式依赖于训练数据(通过实验确定的蛋白质布局的数据库)进行预计。这意味着它们受到已识别的蛋白质数量的限制。当程序/算法遇到突变的蛋白质或与训练时差异很大的蛋白质时,准确率会降低,这种情况在遗传疾病中很常见。
另一种方式是摹拟蛋白质折叠的物理原理。摹拟可以让研讨职员观察给定蛋白质的各种可能外形,并找到最稳定的外形。最稳定的外形对于药物安排至关重要。
图示:蛋白质布局预计管线概述。(起原:论文)
挑战在于,如果蛋白质尺寸超过一定值,这些摹拟在传统估计机上几乎不可能实现。从某种意义上说,增加目标蛋白质的尺寸就好比增加魔方的尺寸。Raubenolt 博士说,对于含有 100 个氨基酸的小蛋白质,传统估计机需要相当于宇宙年龄的时间来详尽地搜索所有可能的结果。
为了克服这些限制,研讨团队采用了量子和典范估计方式的混合方式。该框架可以让量子算法办理最先进的典范估计所面临的挑战,包括蛋白质大小、内在无序性、突变和蛋白质折叠所涉及的物理学。
图示:量子-典范混合框架工作流程示意图。(起原:论文)
与最先进的典范方式相比,该框架通过在量子估计机上准确预计寨卡病毒蛋白小片断的折叠得到了考证。
图示:使用寨卡病毒相关蛋白进行考证。(起原:论文)
量子-典范混合框架的初步结果优于基于典范物理的方式和 AlphaFold2。尽管后者的安排最适合处理较大的蛋白质,但它仍然证明了该框架能够在不直接依赖大量训练数据的情况下建立精确模型的能力。
研讨职员首先使用量子算法来摹拟片断主链的最低能量构象,这通常是估计过程中估计量最大的步骤。然后使用典范方式转换从量子估计机获得的结果,重建蛋白质及其侧链,并使用典范分子力学力场对布局进行最终细化。
图示:估算所需的量子资源。(起原:论文)
该项目展示了将题目分解成各个部分的方式之一,使用量子估计方式办理其中的一些部分,使用典范估计办理其他部分,以提高准确性。
「该项目最独特的一点是涉及的学科数量。」Raubenolt 博士说,「我们团队的专业知识范围广泛,从估计生物学和化学、布局生物学、软件和自动化工程到实验原子和核物理学、数学,当然还有量子估计和算法安排。它使用各个领域的知识来建立估计框架,可以摹拟人类生命中最重要的过程之一。」
该团队将典范估计方式与量子估计方式相结合,对于增进科学家对蛋白质布局的理解以及它们如何影响我们治疗和预防疾病的能力是至关重要的一步。该团队计划继续开发和优化可以预计更大、更复杂蛋白质布局的量子算法。
Doga 博士表示:「这项研讨是探索量子估计能力在蛋白质布局预计中的优势的重要一步。我们的目标是安排出能够尽可能真实地预计蛋白质布局的量子算法。」
论文链接:https://pubs.acs.org/doi/10.1021/acs.jctc.4c00067
相关报道:https://phys.org/news/2024-05-quantum-methods-protein.html