发觉、分解并表征303个新份子,MIT团队开发机器学习驱动的闭环自决份子发觉平台

编辑 | X传统意义上,发觉所需特点的份子过程一直是由手动实验、化学家的直觉以及对机制和第一原理的理解推动的。随着化学家越来越多地使用主动化设备和展望分解算法,自决研讨设备越来越接近实现。近日,来自 MIT 的研讨人员开发了由集成机器学习对象驱动的闭环自决份子发觉平台,以加速具有所需特点的份子的设计。无需手动实验即可索求化学空间并利用已知的化学结构。在两个案例研讨中,该平台尝试了 3000 多个反馈,其中 1000 多个产生了展望的反馈产物,提出、分解并表征了 303 种未报道的染料样份子。该研讨以《Autonom

发觉、分解并表征303个新份子,MIT团队开发机器学习驱动的闭环自决份子发觉平台

编辑 | X

传统意义上,发觉所需特点的份子过程一直是由手动实验、化学家的直觉以及对机制和第一原理的理解推动的。

随着化学家越来越多地使用主动化设备和展望分解算法,自决研讨设备越来越接近实现。

近日,来自 MIT 的研讨人员开发了由集成机器学习对象驱动的闭环自决份子发觉平台,以加速具有所需特点的份子的设计。无需手动实验即可索求化学空间并利用已知的化学结构。

在两个案例研讨中,该平台尝试了 3000 多个反馈,其中 1000 多个产生了展望的反馈产物,提出、分解并表征了 303 种未报道的染料样份子。

该研讨以《Autonomous, multiproperty-driven molecular discovery: From predictions to measurements and back》为题,于 2023 年 12 月 22 日发布在《Science》上。

发觉、分解并表征303个新份子,MIT团队开发机器学习驱动的闭环自决份子发觉平台

论文链接:https://www.science.org/doi/10.1126/science.adi1407

发觉具有所需功能特点的小份子对于健康、能源和可持续发展的进步至关重要。该过程通常是通过缓慢、费力、迭代的设计-制造-测试-分析 (DMTA) 轮回进行的。

新兴的机器学习 (ML) 对象可以生成新的候选份子,展望其特点,并通过计算机辅助分解规划 (CASP) 提出反馈途径。化学主动化的进步可以在手动设置后以最少的人为干预实现化学分解和表征。

将 ML 生成算法、ML 属性展望、CASP、机器人技术和主动化化学分解、纯化和表征集成到 DMTA 工作流程中,可以开发自决化学发觉平台,该平台能够在不同的化学空间中运行,而无需手动重新配置。理想的以属性为中心的发觉平台将提出并分解份子,以丰富机器学习生成和属性模型,并最终发觉性能最佳的份子。实际上,有必要排除可用主动化硬件无法安全施行的反馈。

为了实现自决发觉,来自 MIT 的研讨团队展示了一个集成的 DMTA 轮回,该轮回迭代地提出、实现和表征份子,仅在展望对象的指导下索求化学空间。

图补全(graph-completion)生成模型设计候选份子,并使用 ML 模型针对这三个属性中的每一个进行评估。CASP 对象提出了多步分解配方,由主动液体处理机、批量反馈器、高性能液相色谱 (HPLC) 和机械臂施行。Plate reader 测量吸收光谱,校准的 HPLC 保留时间提供水-辛醇分配系数,模拟太阳光源与 plate reader 结合量化光氧化降解。测得的份子特点会主动反馈以重新训练特点展望模型,从而完成主动化 DMTA 轮回的一个步骤。

发觉、分解并表征303个新份子,MIT团队开发机器学习驱动的闭环自决份子发觉平台

集成平台概述,以及平台展望并成功施行的反馈。(来源:论文)

研讨人员在小份子有机染料的两个份子发觉用例中展示了该平台:(i)索求未知的化学空间和(ii)利用已知的化学空间。该平台根据需要施行并主动调整工作流程,在迭代期间和迭代之间,人工干预仅限于设定和调整目标、提供所需材料以及偶尔修复不可恢复的错误,例如 HPLC 装置堵塞。

发觉、分解并表征303个新份子,MIT团队开发机器学习驱动的闭环自决份子发觉平台

索求案例研讨的化学展望和尝试。(来源:论文)

平台灵活性对于施行包含反馈类别广度的多步反馈途径至关重要,这些反馈类别需要实现涵盖所需属性空间的候选物。研讨通过针对份子染料(具有多种化学性质和复杂份子特点的模型系统)来验证该平台的功能。在两个案例研讨中,该平台尝试了 3000 多个反馈,其中 1000 多个产生了展望的反馈产物,完成了 303 个未报告份子(即在发布之前没有 CAS 登记号)的多步反馈途径。

对于这两个案例研讨,吸收最大值、分配系数和光氧化稳定性是目标属性,平台主动测量和记录每个属性,以完善模型展望并为未来的实验选择提供信息。

研讨人员表示:「该平台的未来迭代将受益于展望能力的改进,特别是反馈保真度、条件推荐和份子生成,以及分析对象。闭环集成平台的持续开发是继续加速份子发觉的一条有希望的道路。」

给TA打赏
共{{data.count}}人
人已打赏
理论

你没有看过的全新版本,Transformer数学原理揭秘

2024-1-2 15:05:00

理论

降低预计误差,中国科学院团队开发用于预计酶动力学参数的统一框架

2024-1-3 11:54:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索