成功率提高四倍,东大、浙师大提出材料合成通用框架,整合 AI、高通量实验和化学先验知识

编辑 | X在过去几年中,数据驱动的机器学习 (ML) 技术已成为设计和发现先进材料的强大工具。然而,由于需要考虑前体、实验条件和反应物的可用性,材料合成通常比性质和结构预测复杂得多,并且很少有计算预测能在实验中实现。为了解决这些挑战,来自东南大学和浙江师范大学的研究团队,提出了一个集成高通量实验、化学先验知识以及子群发现(subgroup discovery)和支持向量机等机器学习技术的通用框架来指导材料的实验合成,能够揭示隐藏在高通量实验中的结构-性质关系,并从广阔的化学空间中快速筛选出具有高合成可行性的材料。

图片

编辑 | X

在过去几年中,数据驱动的机器学习 (ML) 技术已成为设计和发现先进材料的强大工具。然而,由于需要考虑前体、实验条件和反应物的可用性,材料合成通常比性质和结构预测复杂得多,并且很少有计算预测能在实验中实现。

为了解决这些挑战,来自东南大学和浙江师范大学的研究团队,提出了一个集成高通量实验、化学先验知识以及子群发现(subgroup discovery)和支持向量机等机器学习技术的通用框架来指导材料的实验合成,能够揭示隐藏在高通量实验中的结构-性质关系,并从广阔的化学空间中快速筛选出具有高合成可行性的材料。

通过应用所提来解决二维银/铋(AgBi)有机-无机杂化钙钛矿的挑战性和后续合成问题,将合成可行性的成功率相对于传统方法提高了四倍。该研究为利用来自典型实验室、可用实验资源有限的小数据集解决多维化学加速问题提供了一条实用途径。

该研究以「Universal machine learning aided synthesis approach of two-dimensional perovskites in a typical laboratory」为题,于 2024 年 1 月 2 日发布在《Nature Communications》上。

图片

论文链接:https://www.nature.com/articles/s41467-023-44236-5

材料合成面临的挑战

先进功能材料的发现可以帮助人类应对面临的重大全球挑战。然而,材料合成是一个典型的复杂、多维挑战,需要专家评估各种反应条件,例如前体、添加剂、溶剂、浓度和温度。

由于化学前体和实验仪器的可用性和供应的固有限制,合成化学家只能在典型且简单的实验室中的标准优化活动期间评估这些条件的一小部分。同样,对条件的探索通常取决于预定义的优化设计、有关固态合成反应的有限文献以及化学家的经验。

过去十年见证了使用数据驱动技术,特别是机器学习,在新材料发现方面的重大努力。但利用这些技术来指导新材料的实验合成仍然受到限制。

最近,基于机器学习技术和机器人实验的闭环自动合成框架已被证明可以有效加速实验合成过程,但实验成本很高。此外,许多耗时的实验只能提供小规模的数据集,由于可用数据固有的稀疏性和不平衡性,这与传统的机器学习方法不相称。因此,开发一个集成机器学习技术和小规模实验的框架来快速加速材料合成过程对于扩展到新材料领域尤为重要。

2D 钙钛矿材料最有前途的功能材料之一

二维有机-无机杂化钙钛矿(2D HOIP)已成为最有前途的功能材料之一,具有增强的环境稳定性、优异的光学性能、多样化的电子性能以及易于获取和成本效益高的制造。受其优异性能的启发,人们对开发新型、稳定且环保的 2D HOIP 材料越来越感兴趣。

迄今为止,新型二维钙钛矿的设计和发现很大程度上依赖于传统的试错方法。未经探索的化学空间拥有数百万个实验可用的有机分子和数十种无机框架,包含大量潜在的新型 2D HOIP,使得基于传统试错方法的搜索速度缓慢且昂贵。

集成高通量实验、化学先验知识和 ML 的通用框架,指导材料合成

该研究展示了二维银/铋 (AgBi) 碘化物钙钛矿的合成可行性,该材料已被建议应用于光电探测器、发光二极管和 X 射线成像仪。研究人员开发了一个框架,结合小规模高通量实验、量化有机前驱体的空间和拓扑特性以及机器学习技术,以快速筛选具有高合成可行性的 2D HOIP。

图片

图 1:二维银/铋 (2D AgBi) 碘化物钙钛矿的筛选框架。(来源:论文)

训练数据集的质量和数量是开发高性能机器学习模型的基石。考虑到先前报道的 2D 钙钛矿中使用的有机间隔基(organic spacers employed),以及化学直觉和胺的商业可用性,研究选择了 79 种有前景的胺用于 2D AgBi 碘化物钙钛矿合成。

图片

图 2:高通量实验合成结果总结。(来源:论文)

高通量实验结果表明,只有 13 种有机间隔基可以形成 2D AgBi 碘化物钙钛矿结构,化学家直觉成功率为16.4%

鉴于二维钙钛矿的无机层和有机间隔物之间的相互作用,开发了一组用于量化有机前驱体的空间和拓扑性质的信息特征。借助子群发现方法,导出了更有利于形成二维 AgBi 碘化物钙钛矿的区域。

图片

图 3:使用材料描述符可视化 80 种化合物的合成可行性。(来源:论文)

然后,通过应用 ML 技术获得了可以定量评估 2D AgBi 碘化物钙钛矿合成可行性的方程,并预测 8406 个有机间隔物中的 344 个具有形成 2D AgBi 钙钛矿的潜力。

图片

图 4:ML 模型的结果和见解。(来源:论文)

进一步可解释的 ML 技术,即 SHapley Additive exPlanations (SHAP) 分析,强调了有机间隔物的分子拓扑对 2D AgBi 钙钛矿形成的重要性。最终,成功合成了 13 种预测的具有高合成可行性的二维 AgBi 碘化物钙钛矿中的 8 种,表明 ML 引导的二维碘化 AgBi 钙钛矿的成功率可达 61.5%,远高于基于化学直觉的成功率(16.4%)。

图片

图 5:具有高合成可行性和实验验证的 2D AgBi 碘化物钙钛矿的筛选。(来源:论文)

总之,该研究不仅提供了一种快速发现有前景的先进功能材料的实用方法,而且还提供了一个通用的机器学习辅助合成框架,将强大的预测能力与物理化学可解释性相结合。

注:封面来自网络,和该研究无关。

相关资讯

稳健且准确,AlphaFold 结合两种 AI 方法,实现蛋白质化学位移自动分配

编辑 | 绿萝化学位移分配对于基于核磁共振 (NMR) 的蛋白质结构、动力学和相互作用研究至关重要,可提供重要的原子级见解。然而,获得化学位移分配是劳动密集型的并且需要大量的测量时间。为了解决这一限制,苏黎世联邦理工学院(ETH Zurich)的研究人员之前提出了 ARTINA——一种用于自动分配二维 (2D)–4D NMR 谱的深度学习方法。近日,研究人员提出了一种将 ARTINA 与 AlphaFold 和 UCBShift 相结合的综合方法,能够减少实验数据、提高准确性并增强大型系统的稳健性,从而实现化学位移

发现38万种新材料、17天自主合成41种新化合物,DeepMind一日两篇论文登上Nature

编辑 | 萝卜皮从计算机芯片、电池到太阳能电池板等现代技术都依赖于无机晶体。开发这些新技术,所需的晶体必须稳定,否则材料就会分解,而每个新的、稳定的晶体背后可能需要研究人员数月或者更久的艰苦实验。Google DeepMind 材料团队分享了 220 万颗新晶体的发现,相当于近 800 年的知识。该团队推出了新的深度学习工具,用于材料探索的图网络 (GNoME),可通过预测新材料的稳定性来显著提高发现的速度和效率。论文链接: GNoME,科学家可以使人类已知的技术上可行的材料数量成倍增加。在其 220 万个预测中,

可直接比较潜在新药的性能,杜克大学团队开发新的药物AI模型

编辑 | 白菜叶目前的分子机器学习模型往往将单个分子作为输入,来预测其生物、化学或物理特性。然而,此类算法需要大型数据集,并且尚未针对预测分子之间的性质差异进行优化,限制了它们从较小数据集学习的能力,也限制了直接比较两个分子预期性质的能力。杜克大学(Duke University)的研究人员开发了 DeepDelta,这是一种成对深度学习方法,可以同时处理两个分子,并学习从小数据集中预测两个分子之间的属性差异。在 10 个 ADMET 基准任务中,DeepDelta 方法显著优于两种已建立的分子机器学习算法:定向消