开源框架BioChatter助力生物医学研究,降低LLM使用门槛

近年来,大型语言模型(LLMs)在各个领域的应用日益广泛,从内容创作到编程辅助,再到搜索引擎优化,无不展现出其强大的能力。 然而,在生物医学研究中,这些模型的应用仍面临着透明度、可重复性和定制化等方面的挑战。 针对这一问题,海德堡大学与欧洲生物信息研究所(EMBL-EBI)联合提出了一个开源 Python 框架 ——BioChatter,旨在帮助生物医学研究人员更轻松地使用 LLMs。

近年来,大型语言模型(LLMs)在各个领域的应用日益广泛,从内容创作到编程辅助,再到搜索引擎优化,无不展现出其强大的能力。然而,在生物医学研究中,这些模型的应用仍面临着透明度、可重复性和定制化等方面的挑战。

针对这一问题,海德堡大学与欧洲生物信息研究所(EMBL-EBI)联合提出了一个开源 Python 框架 ——BioChatter,旨在帮助生物医学研究人员更轻松地使用 LLMs。

核磁共振 医疗 (2)

图源备注:图片由AI生成,图片授权服务商Midjourney

BioChatter 的设计理念是简化技术复杂性,让研究人员能够专注于他们的研究,而不必担心编程或机器学习的专业技能。通过该框架,研究人员可以从生物医学数据库和文献中提取相关数据,并与外部生物信息学工具实现实时信息访问。这一切得益于 BioChatter 与 BioCypher 知识图谱的无缝集成,后者能够链接诸如基因突变和药物 - 疾病关联等重要数据,极大地支持复杂数据集的分析。

BioChatter 的核心功能包括:与各类大型语言模型的基本问答交互、可复现的提示工程、知识图谱的查询、检索增强生成、模型链式调用等。更为人性化的是,BioChatter 提供了直观的 API 接口,研究人员可以轻松将其功能集成到 Web 应用、命令行界面或 Jupyter 笔记本中。

在实验评估中,研究团队创建了定制化的基准测试,旨在更加准确地评估 BioChatter 的性能。结果表明,使用 BioChatter 的模型在生成正确查询方面明显优于未使用提示引擎的模型,这一发现为 BioChatter 的实际应用提供了有力支持。

展望未来,BioChatter 团队将继续与 Open Targets 等生命科学数据库合作,旨在通过整合人类遗传学和基因组学数据,帮助用户更高效地识别和优先排序药物靶点。此外,他们还在开发一个名为 BioGather 的补充系统,旨在从基因组学、医学笔记及图像等其他临床数据类型中提取信息,以解决个性化医学和药物开发中的复杂问题。

通过 BioChatter,生物医学研究领域的科学家们将能够更高效地利用 LLMs,从而推动科学研究的进步与创新。

相关资讯

九大成像模式一键解析,生物医学图像AI再迎突破!微软、UW等BiomedParse登Nature子刊

作者 | BiomedParse团队编辑 | ScienceAI生物医学图像解析在癌症诊断、免疫治疗和疾病进展监测中至关重要。 然而,不同的成像模式(如MRI、CT和病理学)通常需要单独的模型,造成资源浪费和效率低下,未能充分利用模式间的共性知识。 微软团队最新发布的基础模型BiomedParse,开创性地通过文本驱动图像解析将九种成像模式整合于一个统一的模型中,通过联合预训练处理对象识别、检测与分割任务,实现了生物医学图像解析的新突破。

清华&第四范式&腾讯研究团队:图神经网络与生物医学网络实现新兴药物相互作用预测

编辑 | 萝卜皮新兴药物的药物相互作用 (DDI) 为治疗和缓解疾病提供了可能性,利用计算方法准确预测这些相互作用可以改善患者护理并有助于高效的药物开发。然而,许多现有的计算方法需要大量已知的 DDI 信息,这对于新兴药物来说是稀缺的。清华大学、第四范式(4Paradigm)以及腾讯 Jarvis Lab 的研究人员提出了 EmerGNN,这是一种图神经网络,可以利用生物医学网络中的丰富信息来有效预测新兴药物的相互作用。EmerGNN 通过提取药物对之间的路径、将信息从一种药物传播到另一种药物以及在路径上结合相关的

万字长文,腾讯、清华等多位生物大模型作者专访,畅谈AI生物学,解析大型细胞模型技术

编辑 | KX大型语言模型(LLM)在自然语言处理和理解领域已取得重大突破。在生物学领域,一些采用类似 LLM 结构的大型细胞模型(Large Cellular Model,LCM)被开发用于单细胞转录组学,比如:scBERT、Geneformer、scGPT、scFoundation 和 GeneCompass。这些模型展示了 LCM 在各种生物任务中的应用潜力,并说明了 LCM 彻底改变未来生物学研究的可能性。大型细胞模型的示意图。近日,《Quantitative Biology》期刊采访了一些最具影响力的 L