比传统格式高30倍,中国科学院团队Transformer深度学习模型展望糖-卵白质作用位点

编辑 | 萝卜皮糖类是自然界中最丰富的有机物质,对生命至关重要。了解糖类如何在生理和病理过程中调节卵白质,可以为解决关键的生物学问题和开发新的治疗格式提供机遇。然而,糖类份子的多样性和复杂性,对实验鉴别糖-卵白质连系以及相互作用的位点提出了挑战。在这里,中国科学院团队开发了一种深度学习模型 DeepGlycanSite,它能够准确展望给定卵白质构造上的糖连系位点。DeepGlycanSite 将卵白质的几许和退化特征融入具备 Transformer 架构的深度等变图神经网络中,其性能显著超越了之前的先进格式,并能有

比传统格式高30倍,中国科学院团队Transformer深度学习模型展望糖-卵白质作用位点

编辑 | 萝卜皮

糖类是自然界中最丰富的有机物质,对生命至关重要。了解糖类如何在生理和病理过程中调节卵白质,可以为解决关键的生物学问题和开发新的治疗格式提供机遇。

然而,糖类份子的多样性和复杂性,对实验鉴别糖-卵白质连系以及相互作用的位点提出了挑战。

在这里,中国科学院团队开发了一种深度学习模型 DeepGlycanSite,它能够准确展望给定卵白质构造上的糖连系位点。

DeepGlycanSite 将卵白质的几许和退化特征融入具备 Transformer 架构的深度等变图神经网络中,其性能显著超越了之前的先进格式,并能有效展望各种糖类份子的连系位点。

连系诱变钻研,DeepGlycanSite 揭示了重要 G 卵白偶联受体的鸟苷-5'-二磷酸糖鉴别位点。

这些发现表明 DeepGlycanSite 对于糖连系位点展望具备重要价值,并可以深入了解具备治疗重要性卵白质的糖类调节背后的份子机制。

该钻研以「Highly accurate carbohydrate-binding site prediction with DeepGlycanSite」为题,于 2024 年 6 月 17 日发布在《Nature Communications》。

比传统格式高30倍,中国科学院团队Transformer深度学习模型展望糖-卵白质作用位点

糖在所有生物体的细胞表面普遍存在,它们与多种卵白质家族如凝集素、抗体、酶和转运卵白相互作用,调节免疫反应、细胞分化和神经发育等关键生物学过程。理解糖类与卵白质的相互作用机制是开发糖类药物的基础。

然而,糖类构造的多样性和复杂性,尤其是它们与卵白质连系位点的多变性,给实验数据的获取和药物设计带来了挑战。

比传统格式高30倍,中国科学院团队Transformer深度学习模型展望糖-卵白质作用位点

图示:糖类份子的复杂性和糖连系位点的多样性。(滥觞:论文)

过去,传统的连系位点展望格式不适用于构造复杂、大小变化大的糖类份子。加之高分辨率糖-卵白质复合物构造数据的稀缺,导致展望模型的性能受限。

近年来,随着卵白质数据库(PDB)和开放糖组学资源的快速发展,学界已经积累了超过 19000 个此类复合物的构造数据。这些高质量数据的增加,为采用 AI 技术开发精确的糖连系位点展望模型提供了可能,从而有望加速糖类药物的发现和优化过程。

在最新的钻研中,中国科学院团队引入了 DeepGlycanSite,这是一种深度等变图神经网络 (EGNN) 模型,能够准确展望具备目标卵白质构造的糖连系位点。

比传统格式高30倍,中国科学院团队Transformer深度学习模型展望糖-卵白质作用位点

图示:DeepGlycanSite 概述。(滥觞:论文)

该团队利用几许特征(例如残基内和残基间的方向和距离)以及退化信息,在 DeepGlycanSite 中以残基级别的图形表示形式呈现卵白质。连系具备自注意力机制的 Transformer 块来增强特征提取和复杂关系发现。

在涉及一百多种独特糖连系卵白的独立测试集上,钻研人员将 DeepGlycanSite 与当前最先进的计算格式进行了比较。

结果显示,DeepGlycanSite (0.625) 的平均马修斯相关系数(MCC) 是 StackCBPred (0.018) 的 30 倍以上,同时远超其他序列基础的展望格式。

传统配体连系位点格式可能因疏水性或小尺寸而排除简单糖类份子的连系位点,而 DeepGlycanSite 则能有效鉴别这些位点。

比传统格式高30倍,中国科学院团队Transformer深度学习模型展望糖-卵白质作用位点

图示:比较模型在展望不同糖连系位点方面的表现。(滥觞:论文)

并且,DeepGlycanSite 在展望卵白质上的多个糖连系位点方面也表现出色,这对于理解多价糖缀合物如何影响糖-卵白相互作用以及生物过程的调控具备重要价值。例如,多价糖缀合物被设计成化学工具和药物候选物,以影响糖类份子与凝集素之间的相互作用。

与传统的仅使用卵白质序列或构造信息的格式不同,DeepGlycanSite 充分考虑了卵白质的几许信息及退化特性,这可能是其表现优异的关键因素。

此外,给定查询糖类份子的化学构造,DeepGlycanSite 还可以展望其特定连系位点。

比传统格式高30倍,中国科学院团队Transformer深度学习模型展望糖-卵白质作用位点

图示:查询糖的特定连系位点展望。(滥觞:论文)

钻研人员探索了 DeepGlycanSite 对功能重要的 G 卵白偶联受体 (GPCR) 的应用。利用 AlphaFold2 展望的卵白质构造和糖类化学构造,DeepGlycanSite 成功检测到了人类 P2Y14 上 GDP-Fuc 的具体连系位点。

比传统格式高30倍,中国科学院团队Transformer深度学习模型展望糖-卵白质作用位点

图示:DeepGlycanSite 的实验验证。(滥觞:论文)

虽然 AlphaFold2 展望的侧链质量有待提高,但 DeepGlycanSite 对卵白质构造准确性的依赖较低,能够使用展望的卵白质构造提供糖-卵白相互作用的见解。

综上所述,DeepGlycanSite 在独立测试集和体外案例钻研中的验证表明,它是一个有效的糖连系位点展望工具。钻研人员可以利用 DeepGlycanSite 展望目标卵白质上的糖连系口袋,从而促进对糖-卵白质相互作用的理解。

糖类在生物学功能中扮演着关键角色,DeepGlycanSite 不仅有助于解析糖类份子和糖连系卵白的生物学功能,也为糖类药物的开发提供了有力工具。

论文链接:https://www.nature.com/articles/s41467-024-49516-2

给TA打赏
共{{data.count}}人
人已打赏
理论

言语≠思想,大模型学不了推理:一篇Nature让AI社区炸锅了

2024-6-24 14:50:00

理论

模拟5亿年的退化信息,首个同时推理卵白质序列、构造和功效的生物学大模型

2024-6-26 15:57:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索