编辑 | 萝卜皮
在药物开发过程中,收集有关药物(对象)由于与另一种药物(积淀剂)的药代动力学(PK)药物相互作用(DDI)而导致的临床裸露变化的信息至关重要。
虽然已经发布了许多用于 DDI 的自然语言处理 (NLP) 步骤,但大多数步骤旨在评价文本中是否存在(以及何种)DDI 干系,而不辨认 DDI 的方向(对象与积淀药物)。
在这里,美国食品药品监督管理局(Food and Drug Administration,FDA)的研讨人员提出了一种从文件或药物标签中自动辨认 PK DDI 方向性的步骤。
该团队重新注释了文本分析会议 (TAC) DDI track 2019 语料库,用于辨认 PK DDI 的方向,并按照 TAC 预先指定的训练和验证步骤评价了微调 BioBERT 模型在此任意上的性能。
该研讨以「Deep learning-enabled natural language processing to identify directional pharmacokinetic drug–drug interactions」为题,于 2023 年 11 月 1 日发布在《BMC Bioinformatics》。
在过去的十年中,人们对开发自然语言处理(NLP)步骤以自动从生物医学文件(包括监管药物标签)中提炼和处理信息的兴趣激增。正在积极研讨的 NLP 应用之一是自动辨认药物相互作用 (DDI)。
这是由于潜在 DDI 的高流行可能导致临床环境中的重大不良事件,以及包含自然语言格式的既定 DDI 信息的生物医学文档的快速扩展。机器学习技术(尤其是深度学习/神经网络)的最新进展使得从生物医学文档中自动提炼 DDI 成为可能。
一个明显的例子表明需要对 DDI 信息进行 NLP 自动化步骤,即辨认由于其他积淀药物导致的目标药物临床裸露的变化。这种药代动力学 (PK) DDI 信息不仅在临床开药时很重要,而且在药物开发过程中也很重要:例如,在评价药物引起 QT 延长或致心律失常不良事件的可能性时,国际监管指南要求进行临床和非临床研讨,以涵盖所谓的高临床裸露情况(定义为在存在内在或外在因素,如肾功能受损、PK DDI 等情况下使用药物时的预期裸露量)。
给定特定药物(目标药物),从现有生物医学文件和所有其他药物(积淀药物)的监管标签中收集可能通过 DDI 改变目标药物临床裸露的信息,是建立其高临床裸露的重要一步。
图示:关于涉及维拉帕米的药代动力学 (PK) 药物相互作用 (DDI) 的一对示例句子。(来源:论文)
目前已经有多项旨在鼓励和评价 NLP 技术从生化文件和监管药物标签中提炼 DDI 的举措,例如 2011 年和 2013 年的 DDI 提炼共享任意,以及 2018 年和 2019 年文本分析会议 (TAC) DDI 跟踪。各种 NLP 步骤,包括基于句法和词汇特征的传统机器学习步骤,以及基于神经网络的深度学习步骤,已经在这些举措下进行了评价,并取得了不同程度的成功。
然而,这些现有步骤很难应用于自动提炼由积淀药物 DDI 引起的目标药物临床裸露变化的问题。例如,考虑到「从自然语言文本中辨认维拉帕米临床裸露被另一种药物改变的所有 DDI」的任意,大多数已发表的步骤只能完成句子分类的第一步:筛选文件或产品标签中的所有句子,并辨认那些描述涉及维拉帕米的 DDI 干系的句子。
由于维拉帕米既是细胞色素 P450 酶和 P-糖蛋白的抑制剂,又是 CYP3A4 的底物,因此从第一步中将辨认出大量句子,其中维拉帕米可以是客体药物或积淀药物。因此,在第二步中,大多数句子需要被过滤掉,只留下一小部分具有「正确」方向的 DDI 句子:那些将维拉帕米描述为目标药物的药物,其临床裸露可以被其他(积淀剂)药物改变(图1)。
第二步属于命名实体辨认(NER)的典型 NLP 任意。迄今为止,唯一一次解决确定 PK DDI 方向性的任意是在 TAC 2019 DDI 轨道的任意 3 和 4 中。在提交步骤的四个团队中,只有一个团队尝试了任意 4。但是,这些步骤似乎并未公开。因此,目前似乎还没有任何已发布的 NLP 步骤可以从自然语言文本中自动辨认 PK DDI 的方向。
在这里,FDA 的研讨人员报告了通过 NLP 完成这两个步骤的完整解决方案的开发。该步骤基于最先进的预训练神经网络语言模型 BERT(Transformers 的双向编码器表示)。该团队手动注释了一个语料库来标记对象与积淀药物,然后对之前发布的 BERT 模型进行微调,该模型是根据生物医学文件(BioBERT)进行预训练的。
研讨人员将所得模型命名为 BioBERT_directiveDDI,它旨在按顺序完成两个步骤:首先辨认涉及 PK DDI 的句子,然后标记该句子中的目标药物与积淀药物。
值得注意的是,该过程的第一步将句子分类为一个干系类型,但没有辨认句子中的哪些实体具有这种干系。相比之下,文件中的干系提炼(RE)任意通常辨认与句子中的实体相关的干系类型,并对实体进行预先辨认和匿名化。这使得这里的句子分类任意(第一步)与 RE 任意相似,即辨认干系类型,但辨认该干系涉及哪些实体不是任意的一部分。该程序的第二步将完成此 NER 任意。
图示:训练和验证流程。(来源:论文)
研讨人员使用传统的分类性能指标(例如精度和召回率)以及 F 分数来评价模型的准确性。根据 TAC 2019 DDI 轨道预先指定的验证数据集,该模型在辨认 PK DI 句子(第一步)方面的 F 分数为 0.82,在辨认对象药物与积淀药物(第二步)方面的 F 分数为 0.97。
值得注意的是,该神经网络的最后一层是 softmax 层,它将产生输入样本属于每个类型的概率。例如,在第一步之后,每个句子将被分配一个概率 X (0 < X < 1) 属于「PK-DDI」类型,1-X 属于「其他或无 DDI」类型。由于 X 是连续变量,理论上可以使用接受者操作特征 (ROC) 曲线来说明整个可能分类阈值范围(即 X 的范围)的性能,并选择一个阈值以获得最大性能。研讨人员使用了一种更简单的「最大参数」步骤,本质上将 X 的分类阈值固定为 0.5,因为这种步骤广泛应用于采用神经网络进行分类的机器学习文件中。
总之,该模型能够在制定心脏安全国际指南期间有效评价一些参考药物的高临床裸露,预计将在药物开发活动中发挥重要作用,在药物开发活动中,有必要收集由于 DDI 与其他积淀药物引起的特定药物临床裸露变化的信息。
论文链接:https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-023-05520-9