促进癌症治疗,之江实验室团队开发端到端深度学习模型 DeepAEG

编辑 | 白菜叶由于药物疗效的不确定性和患者的异质性,癌症药物反应的预测是现代个性化癌症治疗中的一个具有挑战性的课题。而且,药物本身的特性和患者的基因组特征可以极大地影响癌症药物反应的结果。因此,准确、高效、全面的药物特征提取和基因组学整合方法对于提高预测精度至关重要。之江实验室的研究团队提出了一种名为 DeepAEG 的端到端深度学习模型,它基于完整图更新模式来预测 IC50 值。并且,研究人员提出了一种新方法,通过采用序列重组来增强简化的分子输入行输入规范数据,从而消除药物分子单一序列表示的缺陷。DeepAEG

促进癌症治疗,之江实验室团队开发端到端深度学习模型 DeepAEG

编辑 | 白菜叶

由于药物疗效的不确定性和患者的异质性,癌症药物反应的预测是现代个性化癌症治疗中的一个具有挑战性的课题。而且,药物本身的特性和患者的基因组特征可以极大地影响癌症药物反应的结果。

因此,准确、高效、全面的药物特征提取和基因组学整合方法对于提高预测精度至关重要。

之江实验室的研究团队提出了一种名为 DeepAEG 的端到端深度学习模型,它基于完整图更新模式来预测 IC50 值。

并且,研究人员提出了一种新方法,通过采用序列重组来增强简化的分子输入行输入规范数据,从而消除药物分子单一序列表示的缺陷。

DeepAEG 在多个测试集的多个评估参数上优于其他现有方法。此外,利用 DeepAEG,研究人员还确定了几种潜在的抗癌药物,包括硼替佐米(它已被证明是一种有效的临床治疗选择)。研究人员认为 DeepAEG 在指导特定癌症治疗方案设计方面具有潜在价值。

该研究以「DeepAEG: a model for predicting cancer drug response based on data enhancement and edge-collaborative update strategies」为题,于 2024 年 3 月 9 日发布在《BMC Bioinformatics》。

图片

癌症仍然是全球主要死亡原因之一,近年来其发病率呈上升趋势。开发具有选择性抗肿瘤作用的新治疗药物具有重要的科学意义和临床价值。

由于癌症的异质性很强,相似的抗癌药物在同一类型的癌症患者中可能会引起不同的反应。这说明癌症个体化治疗意义非凡,即根据患者的基因型信息和生理特征,为患者推荐精准的药物治疗方案,从而提高治疗效果,减少药物副作用。

特别是癌细胞系(CCL)基因组学在个性化癌症药物设计研究中发挥着重要作用。同时,高通量测序技术的发展促进了癌细胞系数据库的发展和积累。

半数最大抑制浓度(IC50)是一个广泛使用的细胞系分析指标。分析癌症相关基因的内在特征及其与抗癌药物的相互作用,可以揭示抗癌分子的潜在特征,从而简化抗癌药物的早期筛选,提高特异性抗癌药物的发现效率。但是现有方法的有效性可能受到其有限的泛化和计算效率的限制。

目前,用于癌症药物预测的机器学习方法包括但不限于逻辑回归、支持向量机、多层神经网络和随机森林。此外,基于深度学习的方法采用复杂的深度神经网络架构,从多源数据中提取复杂的信息。

然而,由于数据表示受到某些限制,在不完整的特征学习过程中,一些潜在的信息可能不可避免地丢失。以往研究的局限性如下:

现有的工作忽略了药物分子中的化学键信息,这对于区分两个化学原子之间的相互作用至关重要。该信息还有可能直接影响药物与癌细胞系相互作用的结果。

以前的工作要么应用基于字符串的方法(例如 SMILES),要么应用基于图形的方法来表示药物分子。然而,这两种方法都可以为药物发现提供补充信息。充分利用这两种信息可以帮助更好地了解药物的潜在表征。

以前的大多数工作仅使用单个基因组图谱来代表癌细胞系,而忽略了多组学数据或 CCL 中包含的丰富信息。基因组多组学特征的范围仍然可以大大扩展。一些已被证明对癌症具有高度信息性的基因组特征尚未被整合和利用。

为了克服上述限制,之江实验室的研究团队提出了一种新颖的多源异构图卷积神经网络,称为 DeepAEG。它是一个端到端的深度学习框架,包括用于 IC50 预测的边缘更新策略和数据增强策略。

图片

图示:DeepAEG 的框架。(来源:论文)

DeepAEG 使用 Transformer 和包含边缘信息的图卷积神经网络来提取药物特征,并结合四个子网络(拷贝数、DNA 甲基化、基因突变、基因表达)来提取癌症组学水平的高级信息,以预测抗癌药物的疗效。

DeepAEG 可以整合多种组学功能。该模型使用一对药物-癌细胞系基因图谱以及相应的真实 IC50 数据和 IC50 量化预测值作为输出。

一方面通过图表示将药物转化为更高层次的潜在表达,另一方面通过Transformer可以得到基于子结构序列提取的向量表示。两种组合形成的药物特征与从四个全连接网络中提取的转录组信息进行拼接,然后输入到由1D CNN组成的线性网络层。研究人员使用 AdamW 优化器,学习率为 1e^-3 ,批量大小为 256,均方误差作为损失函数。模型的具体构建在 keras 中实现。

综合实验表明,边缘信息特征、SMILES 序列重组和扩展多组学图谱的融合优化了药物细胞系反应实例的特征提取能力。DeepAEG 显示了最好的 PCC、SCC 和 RMSE。并且缺失数据预测的结果也确定了潜在有效的药物(硼替佐米,AICA)和最相关的基因。结果展示了 DeepAEG 的预测能力及其在指导癌症特异性治疗方面的潜在价值。

研究人员表示未来的研究方向有以下几个:

(1)由于坐标可以量化两个原子之间的键长,并且键长、键强度和电子密度分布之间存在特定的幂律关系,因此三维分子坐标表达可以丰富药物分子信息并潜在地提高模型预测性能。

(2)通过癌细胞知识图谱,可以实现不同领域知识的整合与融合,满足癌症精准医学背景下多学科知识的整合与应用要求。

DeepAEG 将为不断发展的精准医疗领域做出贡献,促进癌症机制研究和特异性药物开发。

免费获取 DeepAEG:https://github.com/zhejianzhuque/DeepAEG

论文链接:https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-024-05723-8

相关资讯

新加坡国立大学医院新建消化健康中心:利用 AI 量化打分、可检测早期癌症迹象

据新加坡“联合早报”报道,新加坡国立大学医院近日开建消化系统健康中心,该中心将于 2025 年上半年竣工,整合了一系列 AI 技术,旨在重点提升消化系统疾病的早期疾病检测、精确诊断、治疗和预防标准。▲ 图源 PixabayIT之家获悉,新中心将配备计算机辅助检测、诊断和品质控制三重 AI 系统;当这三个系统配合运用时,据称不仅能更有效地识别早期胃肠道病变,还可针对这些病变进行实时可量化打分的癌症诊断。新加坡国立大学医院肠胃与肝脏科主任兼高级顾问医生李冠辉客座副教授指出,从近几年的趋势来看,患消化系统疾病的人逐年增加

OpenAI 拓展医疗保健领域,GPT-4o 模型打造 AI 工具:辅助筛查 / 治疗癌症

OpenAI 公司宣布和 Color Health 合作,借助 AI 开发造福癌症患者的新方法。双方探索使用 GPT-4o 模型创建 AI 工具 Cancer Copilot,帮助医生根据患者数据(包括个人风险因素和家族史)制定筛查和治疗计划。该工具可以识别缺失的诊断结果,并创建量身定制的工作计划,让医疗服务提供者能够就癌症筛查和治疗做出循证决策。IT之家查询公开资料,Color Health 是一家基因检测公司,成立于 2013 年,总部位于加利福尼亚州的伯灵格姆。该公司致力于简化大规模癌症检测和护理,提供技术、

为癌症患者提供治疗方案,软银与美国医疗 IT 企业 TempusAI 成立合资公司

软银集团当地时间 27 日发布新闻稿,宣布与人工智能和精准医疗领域企业 Tempus AI 成立合资公司“SB TEMPUS Corp.”。各方将分别向合资企业投资 150 亿日元(IT之家备注:当前约 6.81 亿元人民币),公司 8 月开始运营,目的是在日本提供精准医疗服务,并通过整合日美医院拥有的图像和临床数据提供适合患者的治疗方案。据介绍,合资公司将利用 Tempus 拥有的美国 770 万个癌症患者数据,结合从日本骨干医院收集的数据,最快在年内推出服务。为了帮助尽可能多的癌症患者,双方将与癌症基因组医学医