成功率提高四倍,东大、浙师大提出资料分解通用框架,整合 AI、高通量尝试和化学先验知识

编辑 | X在过去几年中,数据驱动的呆板进修 (ML) 手艺已成为设计和创造先进资料的强大工具。然而,由于需要考虑前体、尝试条件和反应物的可用性,资料分解通常比性质和结构展望复杂得多,并且很少有计算展望能在尝试中实现。为了解决这些挑战,来自东南大学和浙江师范大学的研讨团队,提出了一个集成高通量尝试、化学先验知识以及子群创造(subgroup discovery)和支持向量机等呆板进修手艺的通用框架来指导资料的尝试分解,能够揭示隐藏在高通量尝试中的结构-性质关系,并从广阔的化学空间中快速挑选出拥有高分解可行性的资料。

成功率提高四倍,东大、浙师大提出资料分解通用框架,整合 AI、高通量尝试和化学先验知识

编辑 | X

在过去几年中,数据驱动的呆板进修 (ML) 手艺已成为设计和创造先进资料的强大工具。然而,由于需要考虑前体、尝试条件和反应物的可用性,资料分解通常比性质和结构展望复杂得多,并且很少有计算展望能在尝试中实现。

为了解决这些挑战,来自东南大学和浙江师范大学的研讨团队,提出了一个集成高通量尝试、化学先验知识以及子群创造(subgroup discovery)和支持向量机等呆板进修手艺的通用框架来指导资料的尝试分解,能够揭示隐藏在高通量尝试中的结构-性质关系,并从广阔的化学空间中快速挑选出拥有高分解可行性的资料。

通过应用所提来解决二维银/铋(AgBi)无机-无机杂化钙钛矿的挑战性和后续分解问题,将分解可行性的成功率相对于传统格式提高了四倍。该研讨为利用来自典型尝试室、可用尝试资源有限的小数据集解决多维化学加速问题提供了一条实用途径。

该研讨以「Universal machine learning aided synthesis approach of two-dimensional perovskites in a typical laboratory」为题,于 2024 年 1 月 2 日发布在《Nature Communications》上。

成功率提高四倍,东大、浙师大提出资料分解通用框架,整合 AI、高通量尝试和化学先验知识

论文链接:https://www.nature.com/articles/s41467-023-44236-5

资料分解面临的挑战

先进功能资料的创造可以帮助人类应对面临的重大全球挑战。然而,资料分解是一个典型的复杂、多维挑战,需要专家评估各种反应条件,例如前体、添加剂、溶剂、浓度和温度。

由于化学前体和尝试仪器的可用性和供应的固有限制,分解化学家只能在典型且简单的尝试室中的标准优化活动期间评估这些条件的一小部分。同样,对条件的探索通常取决于预定义的优化设计、有关固态分解反应的有限文献以及化学家的经验。

过去十年见证了使用数据驱动手艺,特别是呆板进修,在新资料创造方面的重大努力。但利用这些手艺来指导新资料的尝试分解仍然受到限制。

最近,基于呆板进修手艺和呆板人尝试的闭环自动分解框架已被证明可以有效加速尝试分解过程,但尝试成本很高。此外,许多耗时的尝试只能提供小规模的数据集,由于可用数据固有的稀疏性和不平衡性,这与传统的呆板进修格式不相称。因此,开发一个集成呆板进修手艺和小规模尝试的框架来快速加速资料分解过程对于扩展到新资料领域尤为重要。

2D 钙钛矿资料最有前途的功能资料之一

二维无机-无机杂化钙钛矿(2D HOIP)已成为最有前途的功能资料之一,拥有增强的环境稳定性、优异的光学性能、多样化的电子性能以及易于获取和成本效益高的制造。受其优异性能的启发,人们对开发新型、稳定且环保的 2D HOIP 资料越来越感兴趣。

迄今为止,新型二维钙钛矿的设计和创造很大程度上依赖于传统的试错格式。未经探索的化学空间拥有数百万个尝试可用的无机分子和数十种无机框架,包含大量潜在的新型 2D HOIP,使得基于传统试错格式的搜索速度缓慢且昂贵。

集成高通量尝试、化学先验知识和 ML 的通用框架,指导资料分解

该研讨展示了二维银/铋 (AgBi) 碘化物钙钛矿的分解可行性,该资料已被建议应用于光电探测器、发光二极管和 X 射线成像仪。研讨人员开发了一个框架,结合小规模高通量尝试、量化无机前驱体的空间和拓扑特性以及呆板进修手艺,以快速挑选拥有高分解可行性的 2D HOIP。

成功率提高四倍,东大、浙师大提出资料分解通用框架,整合 AI、高通量尝试和化学先验知识

图 1:二维银/铋 (2D AgBi) 碘化物钙钛矿的挑选框架。(滥觞:论文)

训练数据集的质量和数量是开发高性能呆板进修模型的基石。考虑到先前报道的 2D 钙钛矿中使用的无机隔断基(organic spacers employed),以及化学直观和胺的商业可用性,研讨选择了 79 种有前景的胺用于 2D AgBi 碘化物钙钛矿分解。

成功率提高四倍,东大、浙师大提出资料分解通用框架,整合 AI、高通量尝试和化学先验知识

图 2:高通量尝试分解结果总结。(滥觞:论文)

高通量尝试结果表明,只有 13 种无机隔断基可以形成 2D AgBi 碘化物钙钛矿结构,化学家直观成功率为16.4%

鉴于二维钙钛矿的无机层和无机隔断物之间的相互作用,开发了一组用于量化无机前驱体的空间和拓扑性质的信息特征。借助子群创造格式,导出了更有利于形成二维 AgBi 碘化物钙钛矿的区域。

成功率提高四倍,东大、浙师大提出资料分解通用框架,整合 AI、高通量尝试和化学先验知识

图 3:使用资料描述符可视化 80 种化合物的分解可行性。(滥觞:论文)

然后,通过应用 ML 手艺获得了可以定量评估 2D AgBi 碘化物钙钛矿分解可行性的方程,并展望 8406 个无机隔断物中的 344 个拥有形成 2D AgBi 钙钛矿的潜力。

成功率提高四倍,东大、浙师大提出资料分解通用框架,整合 AI、高通量尝试和化学先验知识

图 4:ML 模型的结果和见解。(滥觞:论文)

进一步可解释的 ML 手艺,即 SHapley Additive exPlanations (SHAP) 分析,强调了无机隔断物的分子拓扑对 2D AgBi 钙钛矿形成的重要性。最终,成功分解了 13 种展望的拥有高分解可行性的二维 AgBi 碘化物钙钛矿中的 8 种,表明 ML 引导的二维碘化 AgBi 钙钛矿的成功率可达 61.5%,远高于基于化学直观的成功率(16.4%)。

成功率提高四倍,东大、浙师大提出资料分解通用框架,整合 AI、高通量尝试和化学先验知识

图 5:拥有高分解可行性和尝试验证的 2D AgBi 碘化物钙钛矿的挑选。(滥觞:论文)

总之,该研讨不仅提供了一种快速创造有前景的先进功能资料的实用格式,而且还提供了一个通用的呆板进修辅助分解框架,将强大的展望能力与物理化学可解释性相结合。

注:封面来自网络,和该研讨无关。

给TA打赏
共{{data.count}}人
人已打赏
理论

专补大模型短板的RAG有哪些新进展?这篇综述讲明白了

2024-1-8 11:27:00

理论

NVIDIA 与 Deepcell 合营,加快生成式 AI 在单细胞研讨中的运用

2024-1-9 14:35:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索