编辑 | 紫罗
AI 在简化药物发现方面的应用正在爆炸式增长。从数十亿种候选份子中挑选出可能具有开发新药所需特性的份子。需要思虑的变量太多了,从材料价格到出错的风险,即使科学家应用 AI,权衡分解最好候选份子的利润也不是一件容易的事。
在此,MIT 钻研职员开发了一个定量决议计划算法框架 SPARROW,来自动识别最好份子候选物,从而最大限度地降低分解利润,同时最大限度地提高候选物具有所需特性的可能性。该算法还确定了分解这些份子所需的材料和实验方法。
SPARROW 思虑了一次分解一批份子的利润,因为多个候选份子通常可以从一些相同的化合物中衍生出来。此外,这种统一的方法可以从在线存储库和广泛应用的 AI 工具中获取有关份子计划、性质猜测和分解规划的关键信息。
除了帮助制药公司更有效地发现新药外,SPARROW 还可以用于发明新的农用化学品或发现有机电子产品的专用材料等。
相关钻研以《An algorithmic framework for synthetic cost-aware decision making in molecular design》为题,于 6 月 19 日发布在《Nature Computational Science》上。
论文链接:https://www.nature.com/articles/s43588-024-00639-y
「化合物的抉择是一门艺术,有时它是一门非常乐成的艺术。但鉴于我们拥有整个这些模型和猜测工具,它们能提供关于份子可能如何表现以及如何分解的信息,我们应该应用这些信息来指导我们做出的决议计划。」论文通讯作者 、MIT 化学工程系助理教授 Connor Coley 说。
定量决议计划算法框架 SPARROW
「分解规划和基于赞美的轨道优化工作流程」(Synthesis Planning And Rewards-based Route Optimization Workflow,SPARROW),是一种用于驱动计划周期的算法决议计划框架。
图示:SPARROW 概述及其在份子计划周期中的作用。(来源:论文)
该钻研建立在早期的问题公式的基础上,用于同时抉择多个份子的分解轨道,以及产品和工艺系统计划的集成。与传统的挑选方法不同,SPARROW 应用一个多方针优化标准,倾斜利润与功效,从候选份子库中对份子及其假设的分解轨道进行优先排序。
SPARROW 生成由候选方针份子和分解轨道组成的反映网络。通过解决基于图的优化问题,可以挑选出一组份子和分解轨道,以最好地倾斜累积分解利润和功效。在此背景下,功效衡量评估份子属性的价格。
功效的适当衡量标准将因应用和计划的不同阶段而异。它可能包含份子属性猜测、这些猜测中的不确定性或新数据点改善结构-属性关系的潜力。必须向 SPARROW 提供一个候选库,并提供相应的赞美,以表明与每个候选份子相关的功效。
图示:SPARROW 的问题表述。(来源:论文)
抉择一个份子所获得的赞美还取决于所选分解该份子的反映方法是否乐成。如果候选份子分解轨道中的某个反映方法失败,则无法获得任何信息。钻研职员通过最大化抉择一个候选份子的预期赞美来形式化这一点,该预期赞美可以用其赞美乘以乐成分解该份子的概率来表示。
倾斜利润和功效,SPARROW 的方针可以形式化为整个选定方针的预期赞美除以应用选定轨道分解整个选定方针的利润。
复杂的利润考量
从某种意义上说,科学家是否应该分解和测试某种份子,归结为分解利润与实验价格的问题。然而,确定利润或价格本身就是一个难题。
SPARROW 通过思虑分解份子所涉及的共享中间化合物并将该信息纳入其利润与价格函数来应对这一挑战。
「当你思虑计划一批份子的优化问题时,添加新结构的利润取决于你已经抉择的份子。」Coley 说。
该框架还思虑了诸如起始材料的利润、每条分解轨道所涉及的反映数量,以及这些反映在第一次尝试时乐成的可能性等因素。
要应用 SPARROW,科学家需提供一组他们正在思虑测试的份子化合物,以及他们希望找到的属性定义。
接下来,SPARROW 收集有关份子及其分解途径的信息,然后权衡每个份子的价格与分解一批候选物的利润。它会自动抉择符合用户标准的最好候选子集,并为这些化合物找到最具利润效益的分解轨道。
论文一作 Jenna Fromer 说:「它在一步中完成了整个这些优化,因此它可以同时捕捉整个这些相互竞争的方针。」
多功能框架
SPARROW 的独特之处在于它可以整合人类手工计划的份子结构、虚拟目录中存在的份子结构,或生成式 AI 模型创造的从未见过的份子结构。
「我们有各种不同的想法来源。SPARROW 的吸引力之一在于你可以将整个这些想法放在一个公平的竞争环境中。」Coley 补充道。
钻研职员通过三个案例钻研展示了 SPARROW 协调份子计划周期的能力。这些应用说明了 SPARROW 如何(1)乐成倾斜信息增益与分解利润,(2)捕捉一批份子分解利润的非加和性,以及(3)扩展至包含数百个份子的候选库。
图示:SPARROW 在 14 个 ASCT2 抑制剂候选库中倾斜利润和赞美的能力证明。(来源:论文)
他们发现 SPARROW 有效地捕捉了批量分解的边际利润,并确定了常见的实验方法和中间化学品。此外,它可以扩展以处理数百种潜在的份子候选物。
「在化学机器学习社区中,有许多模型可以很好地用于逆分解或份子性质猜测,但我们实际上如何应用它们?我们的框架旨在发挥这些前期钻研的价格。通过创建 SPARROW,我们希望能够指导其他钻研职员应用他们自己的利润和功效函数来思考化合物的挑选。」Fromer 说。
未来,钻研职员希望向 SPARROW 中融入更多复杂性。例如,他们希望让算法能够思虑到测试一种化合物的价格可能并不总是恒定的。他们还希望在其利润与价格函数中包含更多并行化学元素。
参考内容:https://news.mit.edu/2024/smarter-way-streamline-drug-discovery-0617