AI可以改写人类基因组吗?首次由AI从头设计的基因编写器成功编写人类细胞中DNA

编写 | 凯霞生成式 AI 可以对话、写诗、画图、做视频、作曲、写代码......那么,AI 可以改写人类基因组吗?现在,新的 AI 手艺正在为可编写 DNA 的微观生物机制绘制蓝图,这预示着未来科学家将以更高的精度和速度对抗疾病。近日,美国 AI 卵白质设计初创公司 Profluence 推出了 OpenCRISPRTM 计划,发布了世界上第一个开源的 AI 生成的基因编写器。Profluence 展示了通过 AI 从头开始设计的可定制基因编写器,对人类基因组的首次成功准确编写。该手艺基于驱动 ChatGPT 的

AI可以改写人类基因组吗?首次由AI从头设计的基因编写器成功编写人类细胞中DNA

编写 | 凯霞

生成式 AI 可以对话、写诗、画图、做视频、作曲、写代码……

那么,AI 可以改写人类基因组吗?

现在,新的 AI 手艺正在为可编写 DNA 的微观生物机制绘制蓝图,这预示着未来科学家将以更高的精度和速度对抗疾病。

近日,美国 AI 卵白质设计初创公司 Profluence 推出了 OpenCRISPRTM 计划,发布了世界上第一个开源的 AI 生成的基因编写器。

Profluence 展示了通过 AI 从头开始设计的可定制基因编写器,对人类基因组的首次成功准确编写。

该手艺基于驱动 ChatGPT 的相同方法。正如 ChatGPT 通过分析维基百科文章、书籍和聊天记录来学习生成说话一样,Profluent 的手艺在分析大量生物数据,包括科学家已经用来编写人类 DNA 的微观机制,然后创建了新的基因编写器。

相关研讨以「Design of highly functional genome editors by modeling the universe of CRISPR-Cas sequences」为题,于 2024 年 4 月 22 日发布在预印平台 bioRxiv 上。

AI可以改写人类基因组吗?首次由AI从头设计的基因编写器成功编写人类细胞中DNA

论文链接:https://doi.org/10.1101/2024.04.22.590591

OpenCRISPR-1 是一款 AI 创建的基因编写器,由类似 Cas9 的卵白质和引导 RNA 组成,完全应用 Profluence 的大说话模型 (LLM) 开发。

通过 OpenCRISPR 的训练过程,该公司的 AI 从大规模序列和生物背景中学习,生成数百万种自然界中不存在的多种 CRISPR 类卵白质,从而以指数方式扩展了几乎所有已知的 CRISPR 家族。

AI可以改写人类基因组吗?首次由AI从头设计的基因编写器成功编写人类细胞中DNA

OpenCRISPR-1 的结构分析。

为了实现手艺民主化,Profluence 推出了 OpenCRISPR-1 作为初始开源版本,使 AI 设计的基因编写器可以免费获得伦理研讨和商业用途的许可。

Profluence 联合创始人兼首席执行官 Ali Madani 表示:

「尝试用 AI 设计的生物体系编写人类 DNA 是一项科学登月计划。我们的成功预示着未来,AI 可以准确设计所需的内容,来创造一系列定制的疾病疗法。为了刺激基因编写领域的创新和民主化,以推动未来向前发展,我们正在开源该计划的产品。」

探索全部卵白序列变异,AI 只需几小时

到目前为止,卵白质工程界通常依靠基于发现的方法来从自然界复制功能性卵白质,或通过称为定向进化的过程从事迭代修改。许多转化卵白都是偶然发现的。

CRISPR-Cas9 基因编写体系的核心组成部分是 Cas9 卵白,它是一种 RNA 引导的核酸酶,可以搜索人类基因组中的全部 30 亿个核苷酸,并仅在一个特定位点从事切割。

这种核酸酶与单向导 RNA(sgRNA)结合在一起,sgRNA 由一个支架组成,它在结构上与卵白质相互作用,间隔序列可以被编程为靶向基因组中的任何位置。

AI可以改写人类基因组吗?首次由AI从头设计的基因编写器成功编写人类细胞中DNA

CRISPR-Cas 图谱的形成。

鉴于大多数 Cas9 卵白的长度超过 1000 个氨基酸,总体设计空间包含 20^1000 个可能的序列,这比可观测宇宙中的原子数量多几个数量级。然而,由于这些卵白质必须以准确的顺序协调许多相互作用才能实现准确切割,因此即使是单个错误的突变也可以完全破坏卵白质功能。

通过实验探索所有可能的序列变异需要很多很多的时间,但在几个小时内,AI 体系就可以在这个搜索空间中导航从而发现功能性基因编写器。

说话模型生成多种 CRISPR-Cas 卵白

生成卵白质说话模型通常是在涵盖广泛功能的大型、多样化的天然卵白质序列数据集上从事预训练的。它们可以生成反映天然卵白质特性的真实卵白质序列。然而,对于特定的应用,例如新型基因编写器的生成,我们需要引导生成特定的感兴趣的卵白质家族。

为此,Profluence  的研讨团队从事了详尽的数据挖掘,来构建迄今为止最广泛的 CRISPR 体系数据集。将此资源称为 CRISPR-Cas Atlas。

总而言之,研讨发现了 510 万个 CRISPR-Cas 卵白,将这些体系的已知自然多样性总体扩展了 2.7 倍,特别是 Cas9 扩展了 4.1 倍。

为了生成新型 CRISPR-Cas 卵白质,研讨人员在 CRISPR-Cas Atlas 上训练了卵白质说话模型。从这个模型中生成了 400 万个序列,并应用生物信息学手艺去除简并序列并鉴定每个生成的卵白质属于哪个 CRISPR-Cas 家族。与 CRISPR-Cas Atlas 中发现的天然卵白质相比,这组过滤后的生成序列的多样性扩大了 4.8 倍。

AI可以改写人类基因组吗?首次由AI从头设计的基因编写器成功编写人类细胞中DNA

通过卵白质簇的数量来衡量,生成的序列极大地扩展了 CRISPR 相关卵白质家族的多样性。

生成的基因编写器在人类细胞中发挥作用

研讨人员进一步将注意力集中在 CRISPR-Cas9 体系上,并根据 CRISPR-Cas 图谱中的 238,917 个 Cas9 卵白训练了卵白质说话模型。

鉴于 SpCas9 的广泛采用和临床成功,应用模型来生成可与 SpCas9 互操作的 Cas9 类卵白。换句话说,它们结合基因组的相同部分(PAM)并与相同的 sgRNA 兼容;因此,它们可用于相同的应用程序。

然后,从这些生成的序列中选择了 48 个,用于对人类细胞从事严格的功能表征。OpenCRISPR-1 在靶标位点上的活性与 SpCas9 相当(OpenCRISPR-1 的编写为 55.7%,SpCas9 的编写为 48.3%),但令人惊讶的是,脱靶位点的编写减少了 95%(OpenCRISPR-1 的编写率为 0.32%,而 SpCas9 的编写率为 6.1%)。

此外,OpenCRISPR-1 是一种高度新颖的卵白质:它距离 SpCas9 有 403 个突变,距离 CRISPR-Cas 图谱中的任何天然卵白质有 182 个突变。

AI可以改写人类基因组吗?首次由AI从头设计的基因编写器成功编写人类细胞中DNA

多种生成的核酸酶(绿色),包括 OpenCRISPR-1(深绿色),具有与 SpCas9(蓝色)相当或更高的在靶活性,但脱靶活性低得多。

接下来,研讨证明,当与脱氨酶配对时,OpenCRISPR-1 和 SpCas9 在准确编写靶标基因组中的单个碱基时具有相似的活性和特异性。此外,能够通过应用另一个经过 Profluence 训练的卵白质说话模型生成的脱氨酶来保持碱基编写活性,同时提高特异性。

AI可以改写人类基因组吗?首次由AI从头设计的基因编写器成功编写人类细胞中DNA

当应用 ABE8.20(一种高活性工程脱氨酶)以及研讨生成的脱氨酶 PF-DEAM-1 和 PF-DEAM-2 从事碱基编写时,OpenCRISPR-1 的功能与 SpCas9 非常相似。

最后,为了进一步优化生成的核酸酶的活性,研讨人员还训练了一个模型来为任何给定的 Cas9 类卵白生成兼容的 sgRNA。与 SpCas9 的 sgRNA 相比,这些生成的 sgRNA 可以提高所测试的 5 种卵白质中的 4 种生成的核酸酶的活性。

AI可以改写人类基因组吗?首次由AI从头设计的基因编写器成功编写人类细胞中DNA

对于测试的 5 种生成的核酸酶中的 4 种,应用模型生成的 sgRNA 提高了编写效率。

OpenCRISPR-1 只是冰山一角

研讨展示了世界上首次应用基因编写体系成功编写人类基因组,其中每个组件都完全由 AI 设计。

此外,平台能够随意生成更多的基因编写体系;OpenCRISPR-1 只是冰山一角。

团队公开发布了 OpenCRISPR-1,促进在研讨和商业应用中广泛、合乎道德的应用。在向更广泛的社区提供这种分子的过程中,研讨人员希望降低基于 CRISPR 的手艺的治疗、农业和科学应用的成本和进入门槛。

Profluence 副总裁兼基因编写主管 Peter Cameron 表示:「这是一个分水岭,也是我们希望在着手构建下一代基因药物时迭代过程的开始。我们鼓励基因编写社区对 OpenCRISPR-1 从事压力测试。如果有可以针对特定应用从事改进的特定功能,我们想知道,并可以合作优化这些特性。」

参考内容:

https://www.nytimes.com/2024/04/22/technology/generative-ai-gene-editing-crispr.html

https://www.profluent.bio/blog/editing-the-human-genome-with-ai

https://www.businesswire.com/news/home/20240422399482/en/Profluent-Successfully-Edits-Human-Genome-with-OpenCRISPR-1-the-World%E2%80%99s-First-AI-Created-and-Open-Source-Gene-EditorProfluence

给TA打赏
共{{data.count}}人
人已打赏
理论

体外命中率提高75%,Model Medicines&加州大学开发AI驱动的药物发明框架

2024-4-22 16:26:00

理论

探索基本粒子集,人工智能筛选弦实践近乎无限的大概性

2024-4-24 14:09:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索