6.85亿次AI加速模拟,分析2万种材料,Meta发布催化剂数据集OCx24

编辑 | X_X近日,Meta FAIR 与多伦多大学和 VSParticle(荷兰纳米技术工程公司 )合作,发布了开放催化剂实验 2024(OCx24)数据集,该数据集包含 572 个使用湿法和干法合成的样品,并经过 X 射线荧光和 X 射线衍射表征。 为新催化剂的开发提供了宝贵的见解。 该研究是 Meta FAIR 开放催化剂项目的延续,旨在利用人工智能来建模和发现新的催化剂,应对气候变化带来的能源挑战。

6.85亿次AI加速模拟,分析2万种材料,Meta发布催化剂数据集OCx24

编辑 | X_X

近日,Meta FAIR 与多伦多大学和 VSParticle(荷兰纳米技术工程公司 )合作,发布了开放催化剂实验 2024(OCx24)数据集,该数据集包含 572 个使用湿法和干法合成的样品,并经过 X 射线荧光和 X 射线衍射表征。为新催化剂的开发提供了宝贵的见解。

该研究是 Meta FAIR 开放催化剂项目的延续,旨在利用人工智能来建模和发现新的催化剂,应对气候变化带来的能源挑战。

研究人员在实验室合成并测试了数百种用于催化的金属合金。通过 6.85 亿次 AI 加速模拟,分析了 20,000 种材料,试图在模拟和现实之间架起桥梁。

在短短几个月的时间里,OCx24 就识别、合成和测试了 525 种催化剂材料。据称,这些材料可以在碳捕获、氢气生产和电池化学等领域发挥关键作用。

图片

相关论文以「Open Catalyst Experiments 2024 (OCx24): Bridging Experiments and Computational Models」为题,于 2024 年 11 月 18 日发布在 arXiv 预印平台。

图片

论文链接:https://arxiv.org/abs/2411.11783

了解原子如何相互作用可以带来许多科学进步,包括将废弃的二氧化碳转化为有价值的化学品,创造可持续的航空燃料、新的药品、可再生能源消费品以及用于各种应用的清洁氢气。

挑战在于模拟原子集在计算上非常昂贵,特别是在模拟大量原子或原子系统如何在较长时间尺度上演化时。

6.85亿次AI加速模拟,分析2万种材料,Meta发布催化剂数据集OCx24

视频:实验流程概述。(来源:Meta)

为了解决这一问题并推动该领域的研究发展,在过去五年中,Meta FAIR 的化学团队发布了多个数据集和 AI 模型,旨在通过 Meta Open Catalyst、Meta Open DAC 和 Meta Open Materials 加快相关领域的计算速度。

与其他通常具有专有性的行业主导的研究不同,这些新工具为更广泛的学术界带来了全面的数据集和最先进的模型,从而可以进行更准确、更可扩展的研究。

图片

图示:计算和实验筛选研究总结以及由此产生的结果。(来源:论文)

该实验室正努力将理论概念转化为实际应用。计算模型通常提供物理世界场景的简化表示,但它们的结果仍需要在实际实验室环境中得到验证。

基于互补的专业知识和资源,Meta FAIR 与多伦多大学和 VSParticle 合作,建立了一条用于合成和测试大量混合金属催化剂材料的精简流程。这项为期两年的研究产生了超过 600 种材料的数据集 OCx24,帮助社区开始弥合计算预测和实验结果之间的差距。

通过实验证明计算预测的有效性是一个复杂的过程。它需要合成各种各样的催化剂,确认生成的材料符合预期目标,最后在工业相关条件下测试催化剂。

实验+计算

对于实验筛选,OCx24 采用两种合成技术,即化学还原和火花烧蚀,合成了 572 个样品,涵盖了 13 种不同元素的多种样品。

为了表征每个样品,分别进行了 X 射线荧光 (XRF) 和 X 射线衍射 (XRD) 以确定其成分并阐明合成样品的纯度和结构。使用自动化 XRD 多相识别管道识别出纯度更高、结构与目标材料一致的相。汇总相似成分后,剩余 179 个实验目标用于下游建模工作。

图片

图示:实验流程,从合成到特性分析和测试过程。(来源:论文)

研究准备了 441 个气体扩散电极(包括重复品),并在电流密度高达 300 mA/cm^2 下,使用零间隙电解对其进行了二氧化碳还原(CO2RR)和析氢反应(HER)评估。

对于计算筛选,OCx24 计算了 19,406 种材料的 6 种吸附中间体(OH、CO、CHO、C、COCOH、H)的吸附能。考虑了材料项目(MP)、开放量子材料数据库(OQMD)和 Alexandria 中在反应条件下 (Pourbaix 分解能小于 0.05 eV/原子) 具有热力学稳定性的任何材料。使用结合 AI 和 DFT 计算的 AdsorbML 管道,对米勒指数高达 2 的表面终端执行吸附能计算。

这项工作需要 6.85 亿个结构弛豫和 ∼2000 万个 DFT 单点,是迄今为止任何应用领域最大规模的催化剂计算筛选。

通过结合实验和计算结果,研究人员建立了氢析出反应的预测模型。使用 H 和 OH 的吸附能作为特征,对模型进行训练,以预测 50 mA/cm^2 产率下的电池电压。

图片

图示:析氢反应活性。(来源:Meta)

为了进行测试,多伦多大学开发了一条高通量测试管道,每天可以进行 30 次实验。研究人员测试了用于绿色氢气生产的催化剂,目的是找到可以替代昂贵的铂基氢析出反应 (HER) 催化剂的新型低成本催化剂。

使用基于实验数据的拟合线性模型,研究人员对 19,406 种材料进行推理,识别出 Sabatier volcano 的顶部附近含有铂,即使训练数据中没有 Pt 合金。这项分析揭示了数百种潜在的 HER 催化剂,其中许多由低成本元素制成,可提供潜在的经济实惠的替代品。

图片

图示:HER 的萨巴蒂尔火山图,y 轴上的点越高表示催化剂越好。火山形状的形成是因为催化剂需要以恰到好处的方式吸引反应中的分子——既不能太强,也不能太弱。对超过 19,000 种材料进行了推断。(来源:Meta)

实验结果与计算描述符之间的相关性随着训练数据集大小的增加而提高。通过此分析,研究人员预测将数据集大小增加到 10^4 或 10^5 将允许构建更多预测模型。

图片

图示:使用 LOCO 交叉验证评估 HER 相关性结果与数据集大小的关系。(来源:论文)

由于 CO、H2、CH4 和 C2H4 等多种产物的存在,评估 CO2 还原模型十分复杂。预测结果显示 H2 和 CO 之间存在相当的相关性,但要捕捉完整的反应复杂性仍存在挑战。

图片

图示:CO2RR 预测的几种产品的生产率。(来源:论文)

结语

从开展化学和材料科学研究的 Open Catalyst 项目开始,该团队就专注于气候应用,例如可再生能源储存、绿色氢气生产和可再生能源燃料生产。为推动这些过程的反应寻找低成本且有效的催化剂对于实现碳净零未来至关重要。成功完成这一研究挑战为改变世界提供了机会,类似于研究蛋白质以发现药物。

「通过这次合作,我们在材料发现方面取得了新突破。」Meta AI 研究主管 Larry Zitnick 说,「这标志着我们预测和验证清洁能源解决方案关键材料的能力有了重大飞跃。我们在电催化剂上取得的研究成果表明,人工智能在应对紧迫气候挑战方面具有巨大潜力。」

「通过以前所未有的速度生产独特的电催化剂,我们与 Meta 和多伦多大学的合作不仅有助于验证多年的理论,而且还缩短了从发现到应用的时间表;扫清了数十年来阻碍先进材料发展的瓶颈。」 VSParticle 联合创始人兼首席执行官 Aaike van Vugt 表示。

展望未来,研究人员很高兴能继续利用人工智能帮助缓解气候变化的影响,并继续探索人工智能在材料科学发现中的其他有影响力的应用。

潜在的应用范围非常广泛。例如,除了这项关于催化剂的研究之外,该团队还与 Meta 的 Reality Lab Research 合作,在原子水平上对材料进行建模,以发现可用于推动 AR 眼镜创新的新型晶体。

研究人员坚信,随着人工智能模型变得更加高效,并提高其在各种材料和分子中的推广能力,我们将看到各个行业的突破,这将对人类以及我们与技术的互动方式产生深远的影响。

相关内容:

https://x.com/jehad__abed/status/1858922687198097607

https://ai.meta.com/blog/open-catalyst-simulations-experiments/

https://www.theengineer.co.uk/content/news/meta-ai-helps-build-experimental-catalyst-database

文内视频链接:https://mp.weixin.qq.com/s/FTrs1kJGlWrZShDUZUjHtQ

相关资讯

打破GNN与语言模型间壁垒,图辅助多模态预训练框架用于催化剂筛选,登Nature子刊

编辑 | KX吸附能是一种反应性描述符,必须准确预测,才能有效地将机器学习应用于催化剂筛选。 该过程涉及在催化表面上的不同吸附构型中找到最低能量。 尽管图神经网络在计算催化剂系统的能量方面表现出色,但它们严重依赖原子空间坐标。

Meta开发System 2蒸馏技术,Llama 2对话模型任务准确率接近100%

研究者表示,如果 Sytem 2 蒸馏可以成为未来持续学习 AI 系统的重要特征,则可以进一步提升 System 2 表现不那么好的推理任务的性能。谈到大语言模型(LLM)的策略,一般来说有两种,一种是即时的 System 1(快速反应),另一种是 System 2(慢速思考)。其中 System 2 推理倾向于深思熟虑的思维,生成中间思维允许模型(或人类)进行推理和规划,以便成功完成任务或响应指令。在 System 2 推理中,需要付出努力的心理活动,尤其是在 System 1(更自动化思维)可能出错的情况下。因

混合专家更有主见了,能感知多模态分情况行事,Meta提出模态感知型专家混合

混合专家,也得术业有专攻。对于目前的混合模态基础模型,常用的架构设计是融合特定模态的编码器或解码器,但这种方法存在局限:无法整合不同模态的信息,也难以输出包含多种模态的内容。为了克服这一局限,Meta FAIR 的 Chameleon 团队在近期的论文《Chameleon: Mixed-modal early-fusion foundation models》中提出了一种新的单一 Transformer 架构,它可以根据下一个 token 的预测目标,对由离散图像和文本 token 组成的混合模态序列进行建模,从而