迈向程序化蛋白质生成

编译 | 波菜叶机器进修算法在计算蛋白质计划中的应用比来取得了许多成就,例如从氨基酸序列预测3D构造以及可以折叠成所需3D构造的蛋白质序列的逆向计划。然而,从头蛋白质构造生成——即生成具备所需特征的蛋白质构造——仍然是一项艰巨的任务。巨大的蛋白质份子空间,以及功能性蛋白质仅由所有可能的蛋白质份子的一小部分组成的事实,使得有效识别序列、构造和功能(或性质)之间的关系变得困难。虽然深度生成模型促进了蛋白质构造的生成,但仍然存在一些寻衅,例如完整蛋白质复杂性的生成、具备不同计划拘束的条件采样而不需要重新训练模型,以及随着

迈向程序化蛋白质生成

编译 | 波菜叶

机器进修算法在计算蛋白质计划中的应用比来取得了许多成就,例如从氨基酸序列预测3D构造以及可以折叠成所需3D构造的蛋白质序列的逆向计划。然而,从头蛋白质构造生成——即生成具备所需特征的蛋白质构造——仍然是一项艰巨的任务。

巨大的蛋白质份子空间,以及功能性蛋白质仅由所有可能的蛋白质份子的一小部分组成的事实,使得有效识别序列、构造和功能(或性质)之间的关系变得困难。

虽然深度生成模型促进了蛋白质构造的生成,但仍然存在一些寻衅,例如完整蛋白质复杂性的生成、具备不同计划拘束的条件采样而不需要重新训练模型,以及随着复杂性的增加缺乏公道的缩放行为 。

在比来的一项工作中,Gevorg Grigoryan 团队开发了一种深度生成模型(基于图像常用的改良集中模型)来克服上述寻衅,使得生成具备各种用户定义的拘束的物理公道且可计划的蛋白质构造成为可能。

迈向程序化蛋白质生成

论文链接:https://www.nature.com/articles/s41586-023-06728-8

开发的框架——Chroma——包含三个关键模型计划,用于实现高质量的蛋白质生成。

第一个是使用集中模型,该模型可以进修逆转相关噪声过程以匹配天然蛋白质的距离统计。此外,受多体物理学的力计算方法的启发,作家计划了一种神经网络(NN)架构,该架构使用随机远程图毗邻和毗邻统计来更新份子坐标。

值得一提的是,这种神经网络计划允许计算以半二次方的方式缩放残基数量。最后,Chroma 将低温采样方法与改良的采样骨架质量相结合,这为选择蛋白质计划拘束提供了更大的灵活性。

作家表明,Chroma 可以通过适应许多外部拘束来生成大蛋白质份子,包括拉丁字母或阿拉伯数字的对称性、形态、语义和几何形态。更重要的是,实验验证表明计划的蛋白质具备构造准确性和良好的特征。总体而言,Chroma 揭示了生成蛋白质模型在蛋白质计划中有效编程属性和功能的能力。

迈向程序化蛋白质生成

相关链接:https://www.nature.com/articles/s43588-023-00579-z

给TA打赏
共{{data.count}}人
人已打赏
理论

超10亿个核苷酸水平的测量,首个RNA根基模型解锁RNA药物发现

2023-12-26 11:29:00

理论

LLM与药物发现结合,NVIDIA、Mila、Caltech团队发布多模态份子结构-文本模型

2023-12-26 11:52:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索