编辑 | ScienceAI
近日,浙江大学杭州国际科创中心生物与分子智造研究院邢华斌传授团队和陈华钧传授团队瞄准多孔吸附剂质料的精准智造,开发出大师学问共进修的晶态多孔质料吸附功能端对端深度进修框架 DeepSorption,有效提升多孔质料吸附功能的猜测精度与速度,并实行了原子标准的可解释性。
这一成果以《Direct prediction of gas adsorption via spatial atom interaction learning》为题,于 2023 年 11 月 3 日发表在《Nature Communications》上。
论文链接:https://www.nature.com/articles/s41467-023-42863-6
基于多孔质料的物理吸附技术为二氧化碳捕获、能源气体储存、化工分离过程等全球挑战提供了低成本和节能环保的解决方案。然而,基于 trial-and-error 实验范式的传统高功能多孔质料的筛选和设计方式受到实验时间长、试错成本高等问题的阻碍。
机械进修通过进修多孔质料及其物理吸附行为的学问,为快速发现具有所需吸附特性的质料提供了一种有效的方法。传统的基于大师设计的多孔质料描述符的机械进修算法通过最大限度地包含多孔质料的关键构造信息来提高模型猜测的正确性。然而,由于该方法存在的原始构造信息丢失和描述符生成和处理过程中计算成本高的固有缺点不可避免地会导致误差的传播,造成模型猜测精准度的局限。
端到端的深度进修模型有利于保持完整的原始构造信息,具有实行正确猜测的巨大潜力。然而,要直接从多孔质料构造出发实行有效的吸附功能猜测,还面临三个艰巨的挑战:(1)完整的原始构造信息的输入和传递;(2)原子标准的信息交互和计算以及良好可解释性;(3)在纯数据驱动的深度进修模型中存在的数据饥渴问题。
图 1:DeepSorption 深度进修框架的组成部分及多标准原子注意力机制介绍。
本研究设计并训练了一个内置大师学问共进修模块的空间原子相互作用进修框架 DeepSorption,实行了利用晶态多孔质料的原子坐标和化学元素类型的信息作为输入,构造吸附功能的端对端猜测。
该框架的独特架构在于开发的 Matformer 模型,该模型可以高保真地解释多孔质料的整体构造信息,包括原子空间排列和化学元素信息。此外,模型内的多标准原子注意(MSA)机制实行了对不同标准原子间相互作用的正确、高效认知,并实行了隐藏在编码层中的潜在原子相互作用的可视化。此外为针对纯数据驱动进修中存在的数据饥渴的弊端,采用了大师学问共同进修(knowledge co-learning, KCL)策略。
结果表明,KCL 可以将大师学问作为猜测的辅助任务,促进模型在构造-吸附功能构效关系空间中的收敛,有利于提高吸附性质的猜测精度。值得注意的是,大师学问的输出只在模型训练时需要,而不干扰猜测过程,保证了快速的猜测速度。
DeepSorption 深度进修框架拥有时间效率高、误差传播少以及数据效率高的优点。与巨正则蒙特卡罗分子模拟和其他机械进修模型相比,使用DeepSorption 进行晶态多孔吸附剂的气体吸附曲线猜测的精度更高、速度更快。与基于大师信息描述符的机械进修模型和晶体图神经网络 CGCNN 相比,DeepSorption 在多个二氧化碳和氮气的吸附量数据集上猜测功能的平均绝对误差下降了 20-35%。
图 2:DeepSorption 在 CoREMOF 和 hMOF 数据集上猜测功能和对比。
DeepSorption 通过空间原子相互作用进修网络实行了晶体多孔质料复杂吸附特性的正确、快速猜测。得益于多标准原子注意机制,DeepSorption 能够正确评估原子之间的相互作用,实行物理吸附行为猜测,并提供直观的可视化思维和执行轨迹。复杂物理化学性质的正确猜测凸显了整体构造意识、原子级空间构造信息与化学元素信息的耦合传递和相互作用的重要性。
DeepSorption 深度进修框架不仅实行晶态多孔质料吸附功能的端对端正确猜测,并在原子标准揭示了决定晶体多孔质料表达功能的内在化学性质,并有望成为猜测其他晶体质料(如钙钛矿和晶态催化剂)的各种物理化学和表面性质的一种基准算法工具。
文章的第一作者是浙江大学崔稷宇、清华大学吴方、浙江大学软件学院张文研究员和浙江大学化学工程与生物工程学院杨立峰研究员,浙江大学化学工程与生物工程学院邢华斌传授和浙江大学计算机科学与技术学院陈华钧传授为共同通讯作者。