德国研究团队推出开源 GNN 模型 FIORA 提升质谱分析精准度,推动精准医疗发展

在精准医学与生物标志物发现的浪潮中,非靶向代谢组学扮演着至关重要的角色。 然而,由于现有谱图参比库的不完整,化合物的鉴定依然面临挑战。 为了解决这一问题,德国联邦材料研究与测试研究所(BAM)与柏林自由大学的研究团队联合开发了 FIORA,一种开源图神经网络(GNN),旨在模拟串联质谱的过程,帮助提高质谱识别的准确性。

在精准医学与生物标志物发现的浪潮中,非靶向代谢组学扮演着至关重要的角色。然而,由于现有谱图参比库的不完整,化合物的鉴定依然面临挑战。为了解决这一问题,德国联邦材料研究与测试研究所(BAM)与柏林自由大学的研究团队联合开发了 FIORA,一种开源图神经网络(GNN),旨在模拟串联质谱的过程,帮助提高质谱识别的准确性。

FIORA 模型的核心在于它利用分子中键的局部邻域信息,学习化合物的断裂模式,从而推导出碎离子的概率。与传统的碎裂算法 ICEBERG 和 CFM-ID 相比,FIORA 在质量预测上表现优异,并能够预测如保留时间(RT)和碰撞截面(CCS)等其他特征。这一开创性的研究成果已于2025年3月7日发表在《Nature Communications》上。

image.png

FIORA 的设计充分利用了高性能 GPU,快速验证推定的化合物注释,并通过高质量的预测显著扩展了光谱参考库。这一进展对于推动非靶向代谢组学的研究具有重要意义,尤其是在对未知化合物进行分析时。过去十多年里,由于高质量参考谱的稀缺,该领域的研究进展缓慢。例如,2016年 CASMI 挑战赛显示,计算机模拟方法的召回率仅为34%,而2022年更是未达到30%。这表明迫切需要一种新的解决方案。

FIORA 的独特之处在于,它能够根据每个化合物的局部结构独立评估键解离事件。这种方法比许多现有算法更为直接地模拟质谱中的物理碎裂过程。此外,FIORA 不仅在针对相似化合物时表现出色,其对不熟悉结构的推广能力也令人印象深刻。

为确保其有效性,FIORA 在多个数据集上进行测试,结果显示其预测的质谱与参考谱的相似度中位数达到0.8以上,甚至在某些情况下比竞争算法高出10% 到49%。此外,FIORA 的模块化设计使其可以灵活适应不同的预测目标,展现了出色的多功能性。

FIORA 的推出不仅填补了质谱分析中的空白,更为未来的化合物鉴定与研究提供了强有力的工具。

相关资讯

加速精准医疗,开源GNN实现分子精准建模,质谱识别准确率提升至49%

编辑丨&非靶向代谢组学在推进精准医学和生物标志物发现方面前景广阔。 由于谱图参比库的不完整,从串联质谱中鉴定化合物在当前仍是一项颇有挑战的任务。 为了应对这项挑战,德国联邦材料研究与测试研究所(BAM)与柏林自由大学的一支团队提出了 FIORA,这是一种旨在模拟串联质谱的开源图神经网络。

剑桥团队革新RNA速率分析:AI算法突破基因动态追踪

编辑丨&RNA 速率模型利用剪接和未剪接的 RNA 计数中包含的时间信息来推断转录动力学,但现有的速率模型通常依赖于粗略的生物物理简化或数值近似来求解基础常微分方程(ODE)。 英国剑桥大学主导的团队提出了 cell2fate,它允许以完全贝叶斯方式求解生物物理学上更准确的模型。 通过将 RNA 速率解决方案分解为模块,cell2fate 在 RNA 速率和统计降维之间建立了生物物理联系。

大语言模型加速材料发现,普林斯顿大学团队利用 LLM 准确预测晶体特性

编辑 | X晶体特性的预测在晶体设计过程中起着至关重要的作用。当前预测晶体特性的方法主要集中于使用图神经网络(GNN)对晶体结构进行建模。尽管 GNN 很强大,但准确模拟晶体内原子和分子之间的复杂相互作用仍然是一个挑战。文本数据提供了丰富的信息和表现力,但从晶体文本描述预测晶体特性的研究还不够。主要原因之一是缺乏该任务的公开数据。普林斯顿大学的研究人员创建了一种 AI 工具来预测晶体材料的行为。新方法依赖于大型语言模型(LLM)。通过综合文本描述中的信息(包括原子之间键的长度和角度以及电子和光学特性的测量等细节),