编辑 | 绿萝
化学位移调配对于鉴于核磁共振 (NMR) 的蛋白质构造、动力学和相互作用研讨至关重要,可提供重要的原子级见解。然而,获得化学位移调配是劳动密集型的并且需要大量的测量时间。
为了解决这一限制,苏黎世联邦理工学院(ETH Zurich)的研讨职员之前提出了 ARTINA——一种用于主动调配二维 (2D)–4D NMR 谱的深度进修步骤。
近日,研讨职员提出了一种将 ARTINA 与 AlphaFold 和 UCBShift 相结合的概括步骤,能够增添尝试数据、提高准确性并增强大型零碎的稳健性,从而实现化学位移调配。
研讨证明,与应用所有尝试可用的 NMR 数据(平均每个蛋白质 10 个 3D 光谱,91.37%)的纯 ARTINA 运行相比,五个 3D 光谱产生更准确的调配(92.59%),从而大大增添了所需的测量时间。研讨还报告了在多达 500 个残基的大型合成零碎中提高了调配准确性。
该研讨以《Time-optimized protein NMR assignment with an integrative deep learning approach using AlphaFold and chemical shift prediction》为题,于 2023 年 11 月 22 日发布在《Science Advances》上。
论文链接:https://www.science.org/doi/10.1126/sciadv.adi9323
ARTINA 步骤的优缺点
核磁共振 (NMR) 光谱是一项关键的分析技术,可提供蛋白质构造、动力学和相互作用的详细信息。
应用本质上存在的核自旋探针可以同时获得大量单个原子位置的这些数据。为了实现这种原子分辨率,必须将核自旋的共振频率(以化学位移表示)归因于蛋白质中的各个原子。这种化学位移调配是大多数蛋白质 NMR 研讨的一项关键任务。寻找化学位移调配非常耗时并且需要专业知识。
为了加速 NMR 化学位移调配来改变这种情况,人们应该增添所需光谱的数量,并在不作用结果可靠性的情况下实现分析的主动化。
在此,研讨职员提出了一种步骤,通过利用呆板进修的最新进展并将三维(3D)蛋白质构造中包含的信息有效地纳入调配过程来实现这一目标。后者用于取代必须从额外的核磁共振谱中收集的信息。
通用主动调配步骤 FLYA 最近被嵌入到 NMR 应用人工智能步骤 (ARTINA) 和 NMRtist 网络服务器中,它们应用呆板进修进行可视化光谱分析和其他任务,以主动完成从原始光谱到调配和 3D 构造的蛋白质核磁共振数据分析的整个过程。ARTINA 基本上增添了蛋白质化学位移调配的工作量,增添了样品制备和光谱测量的工作量。
然而,平均而言,需要应用超过 13 个多维 NMR 谱才能获得这些结果,这相当于应用传统采集方案对每个蛋白质进行 2 周以上的 NMR 测量时间。考虑到 ARTINA 算法的计算时间通常小于 2 小时,并且 NMR 波谱仪的操作比计算机的操作成本更高且要求更高,因此增添用于调配的光谱数量是提高生物分子核磁共振项目效率的明显策略。
蛋白质 3D 构造的知识主要可以通过两种方式支持化学位移调配:通过更真实地预测核欧佛豪瑟效应频谱(NOESY)中的预期交叉峰,以及通过鉴于构造的化学位移值的预测。这变得尤为重要,因为 AlphaFold 现在可以准确预测大多数构造化蛋白质的 3D 构造。
ARTINA 与 AlphaFold 和 UCBShift 相结合的概括步骤
鉴于此,研讨职员建立了一种鉴于呆板进修的概括步骤,用于鉴于构造的 NMR 化学位移调配。评价了其性能并确定用于调配主链酰胺基团或所有化学位移的最佳光谱集。
从 ARTINA 原始出版物的 89 种蛋白质的 1170 个尝试光谱开始,研讨定义了 25 组不同的输入光谱,用于 ARTINA 的主动调配计算。
化学位移调配的准确性在三种不同的情况下进行了评价:通过「经典」三共振谱对主链酰胺基团进行调配,通过 3D NOESY 和三共振谱对主链酰胺基团进行调配,以及完成主链和侧链化学位移的调配,并在每种情况下比较 ARTINA 在没有构造输入的情况下获得的调配结果,或仅应用构造生成预期的 NOESY 交叉峰,或者应用 UCBShift(一种化学位移计算程序)步骤将该构造用于预测化学位移。
图 1:尝试数据量对完整蛋白质化学位移调配准确性的作用。(来源:论文)
此外,研讨应用仅用 标记样品记录的 NMR 谱测试了主链酰胺调配的可行性,这可以构成昂贵的 双标记的替代方案。
图 2:尝试数据量对主链酰胺化学位移调配准确性的作用。(来源:论文)
研讨职员应用 3DRobot 生成的大量折叠良好且包装良好的 decoys 来评价输入构造的准确性对调配的作用,这些 decoys 与尝试构造的偏差为 0 到 5Å 均方根偏差(RMSD)。
图 3:所提出的概括步骤中作用化学位移调配准确性的因素。(来源:论文)
研讨职员还评价了概括步骤如何调配大型合成生成的蛋白质零碎(最多 500 个残基),这些零碎目前很少存放在生物磁共振数据库 (BMRB) 数据库中。
图 4:蛋白质大小对主动化学位移调配准确性的作用。(来源:论文)
总之,结合该概括步骤及其评价,研讨职员提出了一套数据驱动的实用建议,用于执行蛋白质的化学位移调配。
概括步骤还具有研讨其他类型零碎的潜力,例如蛋白质复合物、固有无序蛋白质、膜蛋白以及细胞内和固态核磁共振,对于这些零碎,呆板进修步骤与单体零碎同样有前景。