编辑 | 紫罗
「主动驾驭尝试室」是未来?
今年 1 月底,荷兰阿姆斯特丹大学开发自立化学合成 AI 机器人「RoboChem」。一周内,可以优化大约 10~20 个分子的合成。这需要博士生几个月的时间。
还有去年 DeepMind 团队开发的自立尝试室 A-Lab,17 天自立合成 41 种新化合物。
卡内基梅隆大学的 Coscientist,自立设计、规划和执行复杂的科学尝试……
现在,来自美国北卡罗来纳州立大学和全球特种材料公司伊士曼化学公司(Eastman Chemical Company)合作,开发了一个「主动驾驭」催化尝试室:Fast-Cat,利用 AI 和主动化系统,对化学研讨和制造中利用的催化反响进行深入分析。
Fast-Cat 可以在五天内提供比 6 个月的传统尝试更多的信息。
Fast-Cat 是完全自立的,利用人工智能和主动化系统连续进行高温、高压、气液反响。自立技术还分析每个反响的输出,以确定(无需人工干预)不同变量如何影响每个尝试的结果。
麻省理工学院的段辰儒博士告诉 ScienceAI,「Fast-Cat 展示了贝叶斯优化和高通量尝试的有机结合,帮助化学家更加高效的筛选过渡金属催化剂中的配体。我已经可以畅想类似的高通量尝试工作流将在全新催化剂设计,尤其是在找到当前贵金属催化材料更为绿色的替代中发挥重要的作用。」
相关研讨以「Autonomous reaction Pareto-front mapping with a self-driving catalysis laboratory」为题,于 2024 年 2 月 27 日发表在《Nature Chemical Engineering》杂志上。
论文链接:https://www.nature.com/articles/s44286-024-00033-5
传统的催化研讨耗时耗力
配体广泛用于催化,减速和控制从工业化学到制药制造等过程中化学反响的选择性。
配体在过渡金属介导的均相催化剂的化学转化中起着至关重要的作用。尽管配体在均相催化中的作用无可争议,但配体的发觉和开发却是一项极具挑战和资源密集型的工作。
从行业角度来看,希望获得尽可能高的产量和选择性。在进行催化反响时采取的具体步骤会影响产率和灵敏度,因此工业化学家花费大量时间和精力试图找到实现最理想反响结果所需的参数。
铑 (Rh) 催化的烯烃加氢甲酰化生产直链和支链醛是当代工业过程中的一种重要均相反响,具有广泛的应用范围,从日用化学品到特种药品和香料。
「问题在于,传统的催化剂发觉和开发技术是时间、材料和劳动力密集型的。」该研讨的通讯作者、北卡罗来纳州立大学化学和生物分子工程副教授 Milad Abolhasani 说。
这些技术在很大程度上依赖于间歇式反响器的手动样品处理,以及人类的直觉和经验来推动尝试计划。除了材料效率低下之外,这种依赖于人工的催化剂开发方法在执行反响、表征产品和做出下一个尝试的决定之间产生了很大的时间差距。
Abolhasani 说,「这就是我们创建 Fast-Cat 的原因。我们现在能够在五天内更好地了解特定配体的表现,以前可能需要 6 个月。」
图 1:已开发的主动驾驭催化尝试室技术示意图。(来源:论文)
主动驾驭尝试室研讨进展
利用主动驾驭尝试室 (Self-driving laboratory,SDL) 进行闭环自立反响探索是一项疾速新兴的技术,用于减速材料和分子发觉和开发。与传统的手动尝试策略相比,这种自立尝试策略可以减速多目标工艺优化,以满足特定工艺要求。
SDL 的核心在于由机器学习 (ML) 算法编排的尝试数据的主动生成(主动化)。在每次尝试中,SDL 的大脑(即 ML 算法)都会预测系统响应,并迭代地获取一组改进的反响条件,直到达到预期目标。
由于缺乏过渡金属催化均相催化的综合尝试数据和元数据,因此需要开发强大的尝试平台来生成高质量的大数据和可扩展的尝试数据,以利用 SDL 的数据科学工具。
震动反响器在生成大量高质量尝试数据方面具有许多优势,这些数据可以输入到 SDL 的数据科学工具中,从而促进减速催化剂的发觉和开发。
基于实时尝试数据见解疾速迭代、探索和优化催化剂性能的能力是配备震动反响器的 SDL 提供的主要优势。
「主动驾驭」催化尝试室:Fast-Cat
在此,研讨人员提出了一种用于催化减速和尝试的全主动主动驾驭流体技术(Fast-Cat)。
Fast-Cat 采用闭环均相催化系统,利用震动化学平台自立研讨和减速催化剂/配体系统的探索。Fast-Cat 结合了模块化气液震动反响器、在线反响表征、先进的过程主动化和机器学习技术,以减速特种和精细化学品的配体发觉、催化剂基准尝试和工艺开发。
具体来说,研讨人员利用 Fast-Cat 在铑和各类磷基配体存在下对合成气(CO 和 H2)与烯烃(1-辛烯)之间的加氢甲酰化反响进行疾速帕累托前沿(Pareto-front)识别。
在对 Fast-Cat 与大型传统间歇反响器的硬件进行开发、表征和基准尝试后,研讨人员用它来疾速绘制烯烃加氢甲酰化的配体-区域选择性-产率(ligand–regioselectivity–yield)关系。
在仅 5 天的连续自立尝试(45 个反响)内,无需人工干预,Fast-Cat 通过疾速识别 1-辛烯加氢甲酰化中任何所需配体的帕累托前沿,展示了其强大功能。
Fast-Cat 能够在人为干预最少的情况下,进行自立配体基准尝试和多目标催化剂性能评估。
Fast-Cat 利用之前所有尝试的结果(包括成功的和失败的),来决定下一步要做哪个尝试。
「Fast-Cat 的人工智能不断发展,从已经进行的尝试中学习,」Abolhasani 说。
通俗地说,用户让 Fast-Cat 知道它必须从哪些配体和前体化学物质开始,然后通过 60 多个尝试看看它能学到多少东西。
「我们花了很多时间微调 Fast-Cat 的 AI 模型,来优化它,从而尽可能广泛地了解不同参数如何影响利用特定配体的催化反响的选择性和产率。」Abolhasani 说。
Fast-Cat 的硬件
Fast-Cat 的主动化震动化学平台包括五个模块,包括前体装载/配制、前体再填充、震动反响器、反响采样和利用气相色谱法的在线表征(GC)。
Fast-Cat 的 ML 大脑
Fast-Cat 的数字组件包括震动加氢甲酰化反响的主动数据处理和主动尝试选择。Fast-Cat 的 ML 序列首先读取先前评估的尝试条件的内部数据库。
然后,利用 Fast-Cat 生成的尝试数据主动创建当前反响系统的置信模型 (DNN)。
研讨利用的主要采集函数是批处理噪声预期超体积改进(qNEHVI),这是相对于经典贝叶斯单目标预期改进的多目标策略。
图示:利用多目标贝叶斯优化技术的 Fast-Cat 主动尝试选择工作流程概述。(来源:论文)
为了进行概念验证尝试,研讨人员利用 Fast-Cat 来表征研讨文献中已发觉的六种配体的催化性能。报告了所选加氢甲酰化配体的六个完整帕累托前沿优化活动的反响数据和元数据,包括所有尝试的反响。
Abolhasani 说,「我们还花了很多时间来确保 Fast-Cat 的研讨结果具有可扩展性。Fast-Cat 以极小的样本量进行尝试。但如果我们想让它的发觉与实际应用相关,我们需要知道 Fast-Cat 的发觉适用于与工业制造相关的大规模反响。」
为了证明 Fast-Cat 的知识可扩展性,研讨人员选择具有高和低区域选择性值以及产率高于 50% 的配体和加氢甲酰化反响条件在间歇反响器(10 毫升高压釜)中进行尝试。
图示:Fast-Cat 对不同尝试配体的自立 Pareto-front 图。(来源:论文)
知识可扩展性结果表明,生成的知识可以直接从流程转移到间歇反响器,并保持一致的反响结果。这一结果缩小了尝试室规模的 SDL 驱动的发觉与行业相关的扩大生产之间的知识转移和可扩展性差距。
此外,研讨还重点介绍了 Fast-Cat 的一个方面,即生成高质量的尝试数据,用于构建所研讨的均相催化反响的数字孪生。利用 Fast-Cat 内部生成的尝试数据训练的数字孪生作为虚拟表示,有助于理解潜在的反响机制。然后,利用从数字孪生中收集的信息,探索了控制产物醛产率和区域选择性的关键工艺参数。
减速学术界和工业界的催化发觉
由于 Fast-Cat 是模块化的,未来与机器人化学工作站和其他主动化工具的集成将有助于扩展可用于反响空间探索的材料库,从而允许离散变量筛选和优化活动。
论文共同作者、全球特种材料公司伊士曼(Eastman)的全球外部创新经理 Dawn Mason 说:「我们第一次能够疾速评估各种参数,并真正深入了解如何影响每个配体的性能。令人难以置信的是,我们只花了五天的时间来评估每个项目。」
伊士曼企业创新副总裁 Jeff Carbeck 表示:「对于化学和制药行业来说,更好地了解如何影响其在制造过程中利用的催化过程具有真正的价值。Fast-Cat 提供了这种理解,并且疾速、高效,同时利用少量的相关配体和化学前体。换句话说,它疾速、廉价且非常有效。」
研讨人员已将软件和硬件公开,以便可以利用 Fast-Cat 来促进更多研讨。
「我们希望其他研讨人员能够采用这项技术来减速学术界和工业界的催化发觉。」Abolhasa说
参考内容:https://phys.org/news/2024-02-ai-driven-lab-catalysis.html
https://news.ncsu.edu/2024/02/ai-driven-lab-speeds-catalysis-research/