编辑 | 2049
药物研发周期长、成本高是制药行业面临的重大挑战。据统计,一个新药从研发到上市平均需要 12 年时间,投入高达 26 亿美元。为提升研发效率,深度学习在分子生成领域取得了显著进展。然而,大多数方法仅关注「设计什么」,而忽视了「如何合成」这一关键问题。
来自东京科学大学(Institute of Science Tokyo)的研究团队提出了一个名为 TRACER 的创新框架,通过将分子性质优化与合成路径生成有机结合,实现了反应感知的化合物智能探索。
该研究以「Molecular optimization using a conditional transformer for reaction-aware compound exploration with reinforcement learning」为题,于 2025 年 2 月 8 日发表在《Communications Chemistry》。
论文链接:https://www.nature.com/articles/s42004-025-01437-x
研究背景
当前分子生成模型面临的核心矛盾在于「生成能力」与「合成可行性」的割裂。主流方法如 Molecule Chef 等基于潜空间优化的模型,虽能通过反应数据集学习化学转化模式,但受限于单步反应处理和固定模板库(约 100 个反应类型),难以应对真实合成中复杂的区域选择性和化学选择性)。
传统 SA 评分等拓扑方法虽能快速评估合成难度,却无法捕捉动态反应条件的影响。更深层的矛盾在于,现有模型要么像 CasVAE 般依赖预定义模板库导致创新性受限,要么如 DoG-Gen 采用端到端架构牺牲了反应知识的显式建模。这种技术断层导致生成分子中仅 17-43% 具有实际合成价值。
TRACER 的创新突破在于将 1000 种真实反应类型编码为条件令牌,使 Transformer 能同时学习「生成什么」和「如何生成」,为药物发现开辟反应感知的分子设计新维度。
图示:先前研究和拟议方法的比较。(来源:论文)
理论框架:反应知识的三重编码机制
TRACER 的核心理念建立在「反应条件-结构转化-属性优化」的协同学习上。不同于传统潜空间模型将分子与反应信息压缩为连续向量,研究团队采用显式分离架构:图卷积网络(GCN)预测适用反应模板,条件 Transformer 执行具体转化,MCTS 负责全局优化。
图示:全面概述包含条件变压器和 MCTS 的综合模型。(来源:论文)
这种解耦设计使模型能同时处理两类关键信息流——GCN 从分子图中提取的拓扑特征与 Transformer 通过注意力机制捕捉的序列模式。
图示:条件转换器用于在反应模板条件下学习结构转换的程序。(来源:论文)
特别值得关注的是条件令牌的引入,将反应类型索引嵌入 SMILES 序列头部,使模型在训练时能区分胺化、偶联等不同转化类型。如表 1 所示,加入反应条件使完美准确率从 0.2 跃升至 0.6,证明条件信息能有效缩小化学空间搜索范围。
技术实现:虚拟合成树的动态构建
在算法层面,TRACER 通过四阶段 MCTS 实现分子优化与路径生成的闭环。
选择阶段采用改进 UCB 公式平衡探索-利用矛盾,其中价值函数 Q(s) 整合 QSAR 预测值和合成复杂度评估。扩展阶段的双重过滤机制是关键创新:GCN 首轮筛选出 10 个最相关反应模板(top-5 准确率 77.1%),随后通过子结构匹配剔除 30% 不适用方案。
Transformer 在束宽 10-50 条件下生成候选产物,其独特的多步推理能力可处理 Friedel-Crafts 酰化等复杂转化。
图示:对 DRD2 具有最高 QSAR 值的化合物及其合成路线。(来源:论文)
实验显示,相较于无约束 Transformer 仅 43.3% 的母核保留率,TRACER 达到 94.5%,证明其能有效维持药物分子关键骨架。
实验验证:跨越三个靶点的性能突破
在 DRD2、AKT1、CXCR4 靶点的对比实验中,TRACER 展现出独特优势。当束宽优化至 30 时,对 USPTO 库外分子的生成比例达 99.8%,Fréchet ChemNet 距离 14.3,远超 Molecule Chef(2.60)和 SynFlowNet(17.0)。
图示:针对每种蛋白质的分子生成模型之间的比较。(来源:论文)
更值得注意的是,从 ZINC 数据库筛选的初始分子(QSAR≈0)出发,经过 3-4 步虚拟合成即可获得活性值 > 0.5 的化合物,其与已知配体的 Tanimoto 相似度最高达 0.838。
想在合成可行性方面,生成分子平均 SA 评分 2.52 与基准模型相当,但分子量分布更接近上市药物(412 vs 465 Da)。这些数据验证了 TRACER 在探索性(生成新颖结构)与实用性(保证可合成性)之间的精妙平衡。
图示:随机森林中包含的超参数范围和每个目标蛋白质的选定值。(来源:论文)
未来展望
TRACER 框架的突破性价值在于首次实现了分子属性优化与合成路径生成的耦合学习,将 AI 药物发现从「纸上谈兵」推向「实战推演」。实验证明其生成的化合物中大部分包含可商业化获取的砌块,这对加速 DMTA(设计-合成-测试-分析)循环具有现实意义。
当前模型仍受限于初始化合物选择对优化效率的影响,且在涉及多组分反应的场景中预测精度有所下降。未来研究可通过引入反应条件推荐模块、整合逆合成分析,以及扩展至更大规模的反应类型训练数据来增强实用性。
这项研究更深远的意义在于揭示:当 AI 模型能够理解化学转化的内在逻辑时,虚拟分子设计才能真正对接实验室的实际需求。