结合量子特征、2万个份子动力学模拟,新蛋白-配体复合物ML数据集,登Nature子刊

编辑 | 枯叶蝶大型语言模型极大地增强了科学家理解生物学和化学的能力,但鉴于构造的药物发明、量子化学和构造生物学的可靠方法仍然很少。大型语言模型迫切需要精确的生物份子-配体相互作用数据集。为了解决这个问题,德国亥姆霍兹慕尼黑研讨中心构造生物学所和慕尼黑工业大学的研讨职员,提出了 MISATO。这是一个数据集,它结合了小份子的量子力学(QM)特性,还有约 20,000 个实行蛋白质-配体复合物的相关份子动力学(MD)模拟,以及对实行数据的广泛考证。从现有的实行构造出发,研讨职员利用半经验量子力学系统地完善了这些构造。

结合量子特征、2万个份子动力学模拟,新蛋白-配体复合物ML数据集,登Nature子刊

编辑 | 枯叶蝶

大型语言模型极大地增强了科学家理解生物学和化学的能力,但鉴于构造的药物发明、量子化学和构造生物学的可靠方法仍然很少。大型语言模型迫切需要精确的生物份子-配体相互作用数据集。

为了解决这个问题,德国亥姆霍兹慕尼黑研讨中心构造生物学所和慕尼黑工业大学的研讨职员,提出了 MISATO。这是一个数据集,它结合了小份子的量子力学(QM)特性,还有约 20,000 个实行蛋白质-配体复合物的相关份子动力学(MD)模拟,以及对实行数据的广泛考证。

从现有的实行构造出发,研讨职员利用半经验量子力学系统地完善了这些构造。其中包括大量蛋白质-配体复合物在纯水中的份子动力学痕迹,累积时间超过 170μs。

该团队供给了机械进修(ML)基线模型的示例,证明通过使用该数据集可以提高准确性。为机械进修专家供给了一个简单的切入点,以实现下一代药物发明人工智能模型。

该研讨以「MISATO: machine learning dataset of protein–ligand complexes for structure-based drug discovery」为题,于 2024 年 5 月 10 日发布在《Nature Computational Science》。

结合量子特征、2万个份子动力学模拟,新蛋白-配体复合物ML数据集,登Nature子刊

AI 展望技术近年在科学范畴引发革命,如 AlphaFold 能精准展望蛋白质构造。尽管构造导向的药物发明仍是巨大挑战,AI 在此范畴的应用尚浅。当前方法面临精度、计算成本及实行依赖度等难题,且多集中于简单解决方案与一维数据处理,忽视了三维蛋白-配体复合体的复杂性。

虽然存在多种数据库,但因数据量限制和热力学信息缺失,尚未有AI模型能显著推进药物发明,如同 AlphaFold 在蛋白构造展望范畴的成就。此外,AI 模型还受限于忽视动态性、化学复杂性等问题,影响了其在生物份子分析和量子化学上的潜力。

在这里,德国亥姆霍兹慕尼黑研讨中心构造生物学所和慕尼黑工业大学的研讨职员,提出了一个鉴于实行蛋白质-配体构造的蛋白质-配体构造数据库,MISATO(Molecular Interactions Are Structurally Optimized)。

研讨职员表明,该数据库有助于更好地训练与药物发明相关范畴及其他范畴的模型。这包括量子化学、普通构造生物学和生物信息学。

结合量子特征、2万个份子动力学模拟,新蛋白-配体复合物ML数据集,登Nature子刊

图示:MISATO 将 QM 数据与 MD 衍生的蛋白质配体动力学相结合。(来源:论文)

该团队供给了鉴于量子化学的构造管理和细化,包括配体几何形状的正则化。研讨职员用缺失的动态和化学信息来扩充这个数据库,包括时间尺度上的 MD,允许检测某些系统的瞬态和神秘状态。后者对于成功的药物设计非常重要。

结合量子特征、2万个份子动力学模拟,新蛋白-配体复合物ML数据集,登Nature子刊

图示:根据量子化学协议对 PDBbind 数据库进行了优化。(来源:论文)

因此,研讨职员用最大数量的物理参数补充实行数据。这减轻了人工智能模型隐式进修所有这些信息的负担,从而可以专注于主要进修任务。MISATO 数据库供给了一种用户友好的格式,可以直接导入到机械进修代码中。

结合量子特征、2万个份子动力学模拟,新蛋白-配体复合物ML数据集,登Nature子刊

图示:QM、MD 和 AI 模型的实行考证。(来源:论文)

该团队还供给了各种预处理脚本来过滤和可视化数据集。而且,供给了示例 AI 基线模型,用于计算量子化学性质(化学硬度和电子亲和力)、结合亲和力计算以及展望蛋白质灵活性或诱导拟合特征,从而使数据可以被简化采用。并且,QM、MD 和 AI 模型在实行数据上得到了广泛的考证。

研讨职员希望将 MISATO 转变为一个有益的社区项目,造福整个药物发明范畴。

论文链接:https://www.nature.com/articles/s43588-024-00627-2

给TA打赏
共{{data.count}}人
人已打赏
应用

独角兽也卷不动了:AI Agent始创Adept被爆斟酌出卖

2024-5-24 18:49:00

应用

面临AI的厘革期,计划师该何去何从?

2024-5-26 0:12:25

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索