编辑 | 萝卜皮
大规模药物研发和再利用具有挑战性。确定作用机制 (MOA) 至关重要,但目前的方法成本高昂且通量低。
在这里,浙江大学、之江实验室以及斯坦福大学的研究人员介绍了一种通过分析线粒体表型变化来识别 MOA 的方法。
通过对线粒体形态和膜电位进行时间成像,研究人员建立了监测时间分辨线粒体图像的流程,得到了一个数据集,其中包含 570,096 张暴露于 1,068 种美国食品和药物管理局批准药物的细胞单细胞图像。
该团队开发了一种名为 MitoReID 的深度学习模型,该模型使用重新识别 (ReID) 框架和 Inflated 3D ResNet 主干。它提供了一种自动化且经济高效的靶标识别替代方法,可以加速大规模药物发现和再利用。
该研究以「Deep learning large-scale drug discovery and repurposing」为题,于 2024 年 8 月 21 日发布在《Nature Computational Science》。
线粒体形态、膜电位和氧化还原状态已被用于识别功能化合物或遗传扰动的影响;然而,过去的研究仅侧重于提取有限数量的形态特征,导致大量有助于改善目标识别的信息丢失。
为了解决这一限制,浙江大学、之江实验室以及斯坦福大学的研究人员在此引入了时间维度来评估暴露于具有不同作用机理的化合物后的线粒体形态和膜电位。
具体来说,研究人员生成了一个由 1,000 多种美国食品药品管理局 (FDA) 批准的药物治疗的线粒体表型数据集,涵盖 16 个时间点的 570,096 张单细胞图像。
传统的机器学习技术无法充分区分线粒体表型和 MOA 之间的关系,因为在识别时间数据的复杂性方面缺乏兼容性。
因此,该团队通过一种名为 MitoReID 的深度学习模型开发了一种基于线粒体分析的 MOA 识别方法。通过将大规模纵向线粒体动力学监测与深度学习方法相结合,研究人员成功建立了一种快速、自动化、无偏的预测化学物质 MOA 的方法。
深度学习识别MOA框架
MitoReID 框架由四个基本部分组成。
首先,建立一个强大的细胞损伤模型,并将其暴露于 1,068 种 FDA 批准的药物中,以观察应激反应。通过严格的高通量方法,特别关注线粒体形态和膜电位,收集时间序列图像,作为原始数据集的基础。
随后,在重新识别 (ReID) 框架内对这些图像序列进行了创新的深度学习模型 MitoReID 的训练。
在后续阶段,使用训练后的模型提取未见药物和天然化合物的特征。然后使用余弦距离将这些特征与 FDA 批准药物的特征进行匹配,并将与最接近的药物相关的 MOA 推断为预测。
最后,进行了体外生化实验,以验证未鉴定天然化合物的假设作用机理。
图示:通过分析时间线粒体表型,基于深度学习的 MOA 预测框架可用于大规模药物发现和重新利用。(来源:论文)
这个全面的概念框架提供了一种方法来观察细胞对各种 FDA 批准的化合物和天然物质的复杂应激反应,有可能产生新的候选药物并阐明以前未知的作用机理。
更高效更准确
经过评估,该算法能够将 477 种 FDA 批准药物准确地分类为 38 种已知的 MOA,并正确识别六种未知的 FDA 批准药物和数十种天然化合物的 MOA。
图示:使用 MitoReID 根据时间线粒体表型将 477 种 FDA 批准的药物分为 38 种 MOA。(来源:论文)
它在测试集上实现了 76.32% 的 Rank-1 和 65.92% 的平均精度,并根据线粒体表型成功识别了六种未经训练的药物的 MOA。
此外,MitoReID 还确定环氧合酶 2 抑制是茶中天然化合物表儿茶素的作用机制,并在体外成功验证。
图示:高通量采集时间线粒体表型的延时图像。(来源:论文)
MitoReID 表现出预测未见药物和天然化合物的 MOA 的潜力,这可能促进基于细胞器表型相似性的大规模药物发现和重新利用。
MitoReID 的一个突出优势是它能够捕捉全面的线粒体特征,超越了传统形态测量技术的能力。该模型自主学习并整合线粒体形状和时间动态等全局特征,无需复杂的数据预处理、手动特征提取或特征选择。
此外,通过利用 GPU 计算,模型的效率得到提高,即使在大量数据集上也能进行快速预测。
局限性与未来方向
然而,必须承认,MitoReID 的性能会受到数据质量、实验条件和标签注释等因素的影响。
图像模糊和实验变化会极大地影响预测的准确性,因此需要采取严格的数据质量控制措施。此外,准确注释时间线粒体表型仍然是一个挑战,有必要进一步探索,为标记方法建立坚实的理论基础。
为了应对 MitoReID 面临的挑战并进一步提高其性能,研究人员建议将药物-靶点和药物-疾病关系等更多信息整合到深度学习方法中。
图神经网络(GNN)为整合此类信息提供了一条有希望的途径。通过将这些宝贵的知识整合到 GNN 框架中,该团队希望进一步增强 MitoReID 的性能,并提高其预测药物靶标和药物作用机制 (MOA) 的能力。此外,GNN 可以利用所有药物图像来克服目前药物作用机制 (MOA) 标记和分类的局限性。
目前,只有当药物具有完全相同的药物作用机制 (MOA) 时,才会将其划分为不同的类别,而忽略某些药物可能具有重叠的药物作用机制 (MOA) 集这一事实。
GNN 可以克服这一限制,并根据共享的药物作用机制特征为药物创建更细致入微的分类框架。研究人员表示,接下来要寻求改进和扩展 MitoReID 的功能,这种现有知识与先进的深度学习技术的整合将成为他们未来研究工作的重点。
图示:具有不同作用机理的药物表现出不同的线粒体表型。(来源:论文)
此外,该团队的数据集具有巨大的潜力,可以识别对心血管系统和其他线粒体疾病产生积极或消极影响的药物。通过分析与特定疾病相关的药物表型特征,研究人员可以发现潜在的治疗候选药物或识别不良反应。
该数据集的全面性(结合 MitoReID 的强大功能)使研究人员能够研究药物诱导表型与疾病结果之间的复杂关系。这一研究方向对于发现治疗干预措施和优化治疗策略具有巨大的前景。
研究人员在论文里表示:「通过不断改进和扩展我们的方法,融入人类知识,并采用 GNN 等新兴技术,我们期待进一步取得突破,为开发更有效、更有针对性的治疗方法做出贡献。这种多学科方法弥合了计算分析和生物领域专业知识之间的差距,有助于推动药物发现的进步。」
论文链接:https://www.nature.com/articles/s43588-024-00679-4