编辑 | KX
近日,生物技术公司 Atomic AI 宣布,创设了第一个利用化学制图数据的大型语言模型(LLM)。Atomic AI 将尖端呆板进修与最先进的布局生物学相结合,以解锁 RNA 药物发现。
Atomic AI 的研究人员创设了一个新的平台组件,利用内部使用定制湿实验室分析采集的大规模化学作图数据。科学家们采集了数百万条 RNA 序列的数据,并进行了超过 10 亿个核苷酸水平的测量。通过这些数据的训练,ATOM-1 对 RNA 有了丰富的了解,然后可以用来优化不同 RNA 模式的特性。
Atomic AI twitter 地址:https://twitter.com/AtomicAICo/status/1735659469609037974
Atomic AI 于 12 月 14 日发表在 bioRxiv 上的一篇预印本论文《ATOM-1:鉴于化学图谱数据构建的 RNA 布局和性能的根基模型》(「ATOM-1: A Foundation Model for RNA Structure and Function Built on Chemical Mapping Data」)中,Atomic AI 描述了其专有的 ATOM-1™ 平台组件——一个可以准确预计 RNA 布局和性能的根基模型,有助于显著改善 RNA 疗法的开发。
论文链接:https://doi.org/10.1101/2023.12.13.571579
Atomic AI 首席科学官 Manjunath Ramarao 博士说:
「ATOM-1 能够预计 RNA 的布局和性能方面以及 RNA 模式的环节特征,包括小分子、mRNA 疫苗、siRNA 和环状 RNA,以帮助有效安排医治步骤。我们的目标是创设一个简化的药物发现流程,以推进我们自己的管道,并与合作伙伴合作,帮助验证他们的 RNA 靶点和工具,最终快速、更有效地为患者提供所需的医治步骤。」
Atomic AI 创始科学家兼呆板进修主管 Stephan Eismann 博士说:
「通过构建鉴于 RNA 核苷酸修饰和下一代测序的大型数据集,Atomic AI 团队创设了首个 RNA 根基模型。我们对我们的模型在 RNA 研究的其他方面的广泛应用以及它优化鉴于 RNA 的药物的各种特性的潜力感到兴奋,例如 mRNA 疫苗的稳定性和翻译效率或 siRNA 的活性和毒性。」
缺乏可用的高质量 RNA 数据
鉴于 RNA 的药物和 RNA 靶向药物正在成为医治疾病的有前途的新步骤。通过简单的实验筛选来优化这些疗法是一个耗时且昂贵的过程,而合理的安排需要准确理解 RNA 的布局和性能。
迄今为止,生命科学界几乎没有可用的高质量 RNA 数据,因为现有的步骤,如用于采集体内信息的动物模型或用于确定 3D RNA 布局的冷冻电子显微镜(cryo – EM),难以使用且耗时。由于缺乏「真实」数据,优化环节 RNA 医治特性(包括稳定性、毒性和翻译效率)一直具有挑战性。
首个在化学图谱数据上训练的 RNA 根基模型
为了应对这一安排挑战,Atomic AI 推出了 ATOM-1,这是第一个在化学图谱数据上训练的 RNA 根基模型,通过专门为呆板进修训练开发的数据采集策略来实现。在 ATOM-1 嵌入之上使用小型探针(probe)神经网络,证明该模型已经开发了丰富的 RNA 内部表示。经过有限数量额外数据的训练,这些小型网络在环节 RNA 预计任务上实现了最先进的准确性,这表明这种步骤可以实现整个 RNA 领域的疗法安排。
图示:用于二级布局预计的 ATOM-1 探针具有高精度概括。(来源:论文)
与之前发表的步骤相比,ATOM-1 能够更准确地预计 RNA 二级和三级布局。
图示:在一个二级布局上训练的具有 257 个参数的线性探针可推广到其他 RNA。(来源:论文)
图示:用于三级布局预计的 ATOM-1 探针展示了最先进的准确性。(来源:论文)
值得注意的是,在比较 ATOM-1 与其他疫苗安排计算工具的回顾性分析中,ATOM-1 优于所有 1,600 种其他预计溶液内 mRNA 稳定性的步骤。鉴于这些结果,新的根基模型可以用有限的数据进行调整,以预计 RNA 的不同特性,不仅可以确定 RNA 的布局,还可以预计 RNA 疗法的其他环节特征。
图示:ATOM-1 探针与没有根基模型嵌入的基线相比的布局预计。(来源:论文)
「在过去的两年半中,我们一直在有目的地安排和采集数据来训练我们的根基模型,」Atomic AI 创始人兼首席执行官 Raphael Townshend 博士说。「通过呆板进修和生成人工智能,我们现在有了一个独特的机会,ATOM-1 可以通过少量初始数据点进行调整,以高精度预计 RNA 的布局和性能。」
曾登 Science 封面,Atomic AI 专有的 AI 驱动 3D RNA 布局引擎
Atomic AI 是一家新兴生物技术公司,成立于 2021 年 5 月,总部位于旧金山湾区,专注于利用呆板进修和布局生物学的融合来推进 RNA 药物发现。该公司开发了一个专有平台,利用深度进修根基模型来探索和安排 RNA 靶向小分子、鉴于 RNA 的药物和 RNA 工具。
Atomic AI 的技术的相关文章《RNA 布局的几何深度进修》(「Geometric deep learning of RNA structure」)已登上《Science》杂志封面。
Science 封面文章链接:https://www.science.org/doi/10.1126/science.abe5650
Atomic AI 专有的人工智能驱动的 3D RNA 布局引擎(称为 PARSE)可生成 RNA 布局数据集,将呆板进修根基模型与大规模内部实验湿实验室生物学相集成,以揭示 RNA 靶标的性能结合物。
其突破性技术能够以前所未有的速度和准确性预计布局化、可配体的 RNA 基序,这是当前 RNA 药物发现步骤的一个环节障碍。
通过将这些算法进步与大规模实验生物学相结合,能够安排新型 RNA 靶向药物和鉴于 RNA 的药物来医治目前无法成药的疾病。
利用其发现和安排的 3D RNA 布局数据库,Atomic AI 计划开发一系列合理安排的小分子候选药物。
Atomic AI 在两轮投资中筹集了总计 4200 万美元的资金,最新一轮融资于 2023 年 1 月获得 A 轮融资。
在由呆板进修研究人员、药物化学家、工程师和实验生物学家以及战略科学顾问和世界级投资者组成的跨学科团队的支持下,Atomic AI 在人工智能增强的布局生物学领域处于领先地位,并改变了 RNA 药物的安排,以医治无法医治的疾病。
Atomic AI 官网:https://atomic.ai/
参考内容:https://www.businesswire.com/news/home/20231215527488/en/