编辑 | 白菜叶
由于药物疗效的不确定性和患者的异质性,癌症药物反应的预计是现代个性化癌症医治中的一个具有挑战性的课题。而且,药物本身的特性和患者的基因组特性可以极大地影响癌症药物反应的结果。
因此,准确、高效、全面的药物特性提炼和基因组学调整办法对于提高预计精度至关重要。
之江实验室的钻研团队提出了一种名为 DeepAEG 的端到端深度进修模型,它鉴于完整图更新模式来预计 IC50 值。
并且,钻研职员提出了一种新办法,通过采用序列重组来增强简化的份子输入行输入规范数据,从而消除药物份子单一序列表示的缺陷。
DeepAEG 在多个测试集的多个评估参数上优于其他现有办法。此外,利用 DeepAEG,钻研职员还确定了几种潜伏的抗癌药物,包括硼替佐米(它已被证明是一种有效的临床医治选择)。钻研职员认为 DeepAEG 在指导特定癌症医治方案设计方面具有潜伏价值。
该钻研以「DeepAEG: a model for predicting cancer drug response based on data enhancement and edge-collaborative update strategies」为题,于 2024 年 3 月 9 日发布在《BMC Bioinformatics》。
癌症仍然是全球主要死亡原因之一,近年来其发病率呈上升趋势。开发具有选择性抗肿瘤作用的新医治药物具有重要的科学意义和临床价值。
由于癌症的异质性很强,相似的抗癌药物在同一类型的癌症患者中可能会引起不同的反应。这说明癌症个体化医治意义非凡,即根据患者的基因型信息和生理特性,为患者推荐精确的药物医治方案,从而提高医治效果,减少药物副作用。
特别是癌细胞系(CCL)基因组学在个性化癌症药物设计钻研中发挥着重要作用。同时,高通量测序技术的发展促进了癌细胞系数据库的发展和积累。
半数最大抑制浓度(IC50)是一个广泛使用的细胞系分析指标。分析癌症相关基因的内在特性及其与抗癌药物的相互作用,可以揭示抗癌份子的潜伏特性,从而简化抗癌药物的早期筛选,提高特异性抗癌药物的发现效率。但是现有办法的有效性可能受到其有限的泛化和计算效率的限制。
目前,用于癌症药物预计的机器进修办法包括但不限于逻辑回归、支持向量机、多层神经网络和随机森林。此外,鉴于深度进修的办法采用复杂的深度神经网络架构,从多源数据中提炼复杂的信息。
然而,由于数据表示受到某些限制,在不完整的特性进修过程中,一些潜伏的信息可能不可避免地丢失。以往钻研的局限性如下:
现有的工作忽略了药物份子中的化学键信息,这对于区分两个化学原子之间的相互作用至关重要。该信息还有可能直接影响药物与癌细胞系相互作用的结果。
以前的工作要么应用鉴于字符串的办法(例如 SMILES),要么应用鉴于图形的办法来表示药物份子。然而,这两种办法都可以为药物发现提供补充信息。充分利用这两种信息可以帮助更好地了解药物的潜伏表征。
以前的大多数工作仅使用单个基因组图谱来代表癌细胞系,而忽略了多组学数据或 CCL 中包含的丰富信息。基因组多组学特性的范围仍然可以大大扩展。一些已被证明对癌症具有高度信息性的基因组特性尚未被调整和利用。
为了克服上述限制,之江实验室的钻研团队提出了一种新颖的多源异构图卷积神经网络,称为 DeepAEG。它是一个端到端的深度进修框架,包括用于 IC50 预计的边缘更新策略和数据增强策略。
图示:DeepAEG 的框架。(来源:论文)
DeepAEG 使用 Transformer 和包含边缘信息的图卷积神经网络来提炼药物特性,并结合四个子网络(拷贝数、DNA 甲基化、基因突变、基因表达)来提炼癌症组学水平的高级信息,以预计抗癌药物的疗效。
DeepAEG 可以调整多种组学功能。该模型使用一对药物-癌细胞系基因图谱以及相应的真实 IC50 数据和 IC50 量化预计值作为输出。
一方面通过图表示将药物转化为更高层次的潜伏表达,另一方面通过Transformer可以得到鉴于子结构序列提炼的向量表示。两种组合形成的药物特性与从四个全连接网络中提炼的转录组信息进行拼接,然后输入到由1D CNN组成的线性网络层。钻研职员使用 AdamW 优化器,进修率为 1e^-3 ,批量大小为 256,均方误差作为损失函数。模型的具体构建在 keras 中实现。
综合实验表明,边缘信息特性、SMILES 序列重组和扩展多组学图谱的融合优化了药物细胞系反应实例的特性提炼能力。DeepAEG 显示了最好的 PCC、SCC 和 RMSE。并且缺失数据预计的结果也确定了潜伏有效的药物(硼替佐米,AICA)和最相关的基因。结果展示了 DeepAEG 的预计能力及其在指导癌症特异性医治方面的潜伏价值。
钻研职员表示未来的钻研方向有以下几个:
(1)由于坐标可以量化两个原子之间的键长,并且键长、键强度和电子密度分布之间存在特定的幂律关系,因此三维份子坐标表达可以丰富药物份子信息并潜伏地提高模型预计性能。
(2)通过癌细胞知识图谱,可以实现不同领域知识的调整与融合,满足癌症精确医学背景下多学科知识的调整与应用要求。
DeepAEG 将为不断发展的精确医疗领域做出贡献,促进癌症机制钻研和特异性药物开发。
免费获取 DeepAEG:https://github.com/zhejianzhuque/DeepAEG
论文链接:https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-024-05723-8