迈向程序化蛋白质生成

编译 | 波菜叶机器学习算法在计算蛋白质设计中的应用最近取得了许多成就,例如从氨基酸序列预测3D结构以及可以折叠成所需3D结构的蛋白质序列的逆向设计。然而,从头蛋白质结构生成——即生成具有所需特性的蛋白质结构——仍然是一项艰巨的任务。巨大的蛋白质分子空间,以及功能性蛋白质仅由所有可能的蛋白质分子的一小部分组成的事实,使得有效识别序列、结构和功能(或性质)之间的关系变得困难。虽然深度生成模型促进了蛋白质结构的生成,但仍然存在一些挑战,例如完整蛋白质复杂性的生成、具有不同设计约束的条件采样而不需要重新训练模型,以及随着

迈向程序化蛋白质生成

编译 | 波菜叶

机器学习算法在计算蛋白质设计中的应用最近取得了许多成就,例如从氨基酸序列预测3D结构以及可以折叠成所需3D结构的蛋白质序列的逆向设计。然而,从头蛋白质结构生成——即生成具有所需特性的蛋白质结构——仍然是一项艰巨的任务。

巨大的蛋白质分子空间,以及功能性蛋白质仅由所有可能的蛋白质分子的一小部分组成的事实,使得有效识别序列、结构和功能(或性质)之间的关系变得困难。

虽然深度生成模型促进了蛋白质结构的生成,但仍然存在一些挑战,例如完整蛋白质复杂性的生成、具有不同设计约束的条件采样而不需要重新训练模型,以及随着复杂性的增加缺乏合理的缩放行为 。

在最近的一项工作中,Gevorg Grigoryan 团队开发了一种深度生成模型(基于图像常用的改进扩散模型)来克服上述挑战,使得生成具有各种用户定义的约束的物理合理且可设计的蛋白质结构成为可能。

迈向程序化蛋白质生成

论文链接:https://www.nature.com/articles/s41586-023-06728-8

开发的框架——Chroma——包含三个关键模型设计,用于实现高质量的蛋白质生成。

第一个是使用扩散模型,该模型可以学习逆转相关噪声过程以匹配天然蛋白质的距离统计。此外,受多体物理学的力计算方法的启发,作者设计了一种神经网络(NN)架构,该架构使用随机远程图连接和连接统计来更新分子坐标。

值得一提的是,这种神经网络设计允许计算以半二次方的方式缩放残基数量。最后,Chroma 将低温采样方法与改进的采样骨架质量相结合,这为选择蛋白质设计约束提供了更大的灵活性。

作者表明,Chroma 可以通过适应许多外部约束来生成大蛋白质分子,包括拉丁字母或阿拉伯数字的对称性、形状、语义和几何形状。更重要的是,实验验证表明设计的蛋白质具有结构准确性和良好的特性。总体而言,Chroma 揭示了生成蛋白质模型在蛋白质设计中有效编程属性和功能的能力。

迈向程序化蛋白质生成

相关链接:https://www.nature.com/articles/s43588-023-00579-z

相关资讯

Nature | 通过功能优先、人工智能引导的生成模型 Chroma 重塑蛋白质设计

编辑 | 萝卜皮三十亿年的进化已经产生了极其多样化的蛋白质分子,但蛋白质的全部潜力可能要大得多。挖掘这种潜力对于计算和实验来说都是一个挑战,因为可能存在的蛋白质分子的空间,比那些可能具有功能的空间大得多。美国 Generate Biomedicines 的研究团队介绍了 Chroma,一种蛋白质和蛋白质复合物的生成模型,可以直接对新的蛋白质结构和序列进行采样,并且可以进行调节以引导生成过程实现所需的特性和功能。为了实现这一点,研究人员引入了一种尊重聚合物整体构象统计的扩散过程,这是一种分子系统的有效神经架构,它能够

登Nature子刊,中科院计算所团队开发CarbonDesign,进行准确且稳健的蛋白质序列设计

编辑 | 萝卜皮蛋白质是生物体内执行生物功能的基础元件,在催化、免疫和信号传递等生物过程中起着重要作用。一般认为,蛋白质序列设计是蛋白质结构预测的逆问题。具体地,是指从给定的蛋白质三维结构出发,设计出能够折叠成为目标蛋白结构、具有目标蛋白功能的序列。它是从头蛋白质设计的关键一步,一旦主链结构被生成,为其设计最佳序列就变得至关重要。蛋白质序列设计在药物设计、酶工程等领域具有重要应用。由于可能的蛋白质序列和结构比宇宙中的粒子数量还要多,当前实现准确且稳健的蛋白质序列设计,仍然是一个挑战。中国科学院计算技术研究所张海仓、

计算效率领先10倍,中国科大、哈佛功能蛋白质设计深度生成模型登Nature子刊

编辑 | ScienceAI蛋白质作为生命活动的物质基础,就像一块块精巧的「乐高积木」,支撑着生物体内几乎所有的化学反应和生命过程。 从肌肉的收缩到大脑的思维,从病毒的侵染到免疫系统的防护,几乎都依赖这些功能多样的分子。 然而,自然界中的天然蛋白质并不能完全满足人类日益多样化的需求,因此科学家们致力于通过设计与定制蛋白质,赋予其更多复杂的功能。