新一代生物AI模型Evo 2揭开基因密码,助力疾病研究

近日,由 Arc Institute 和 Nvidia 联合开发的 Evo2生物 AI 模型正式发布。 这一基础模型基于超过10万种生物的 DNA 数据,旨在深度解码生物学中的各种复杂现象。 Evo2能够在不同生物体的基因序列中识别出研究者们需要花费多年时间才能发现的模式,极大提升了疾病相关突变的识别能力,并可以设计出与简单细菌相当的全新基因组。

近日,由 Arc Institute 和 Nvidia 联合开发的 Evo2生物 AI 模型正式发布。这一基础模型基于超过10万种生物的 DNA 数据,旨在深度解码生物学中的各种复杂现象。Evo2能够在不同生物体的基因序列中识别出研究者们需要花费多年时间才能发现的模式,极大提升了疾病相关突变的识别能力,并可以设计出与简单细菌相当的全新基因组。

image.png

Evo2的训练涉及超过93万亿个核苷酸的处理,远超其前身 Evo1。其开发团队来自 Nvidia 和位于加州帕洛阿尔托的非营利生物医学研究机构 Arc Institute,还与斯坦福大学、加州大学伯克利分校和加州大学旧金山分校的研究人员密切合作。Evo2不仅具备强大的计算能力,还在透明性和可解释性方面做出了积极探索。为了使科学研究更加开放,研究团队还公开了 Evo2的训练数据、代码和模型权重,标志着其成为迄今为止最大规模的完全开源生物 AI 模型。

image.png

Patrick Hsu,Arc Institute 的共同创始人及 UC Berkeley 的助理教授表示,Evo2的开发是生成生物学领域的一次重要突破。通过这项技术,机器能够 “阅读”、“写作” 和 “思考” 核苷酸的语言,推动了生物研究的进展。Evo2的训练能力与大规模语言模型相媲美,显示出在预测疾病突变及设计潜在人工生命方面的强大潜力。

此外,Evo2还能够为生物疗法的设计提供新思路,例如针对特定细胞类型激活的基因治疗,以减少副作用并提高治疗精度。Evo2的开发不仅是在技术上的突破,同时也对生物学的理解产生了深远影响。

在研究人员确保模型的负责任开发时,特意排除了会感染人类及其他复杂生物的病原体数据。Nvidia 的数字生物学总监 Anthony Costa 表示,Evo2突破了生物基础模型的局限,为全球科学家提供了强大的合作工具,以应对人类面临的重大健康和疾病挑战。

相关资讯

NVIDIA和Arc研究所联合发布全球最大生物学 AI 模型 Evo2,助力基因组研究与设计

日前,Arc Institute 与 NVIDIA 合作,联合斯坦福大学、加州大学伯克利分校和加州大学旧金山分校的研究人员,共同推出了全球最大的生物学人工智能模型 ——Evo2。 该模型以超过128,000个基因组的数据为基础,训练了9.3万亿个核苷酸,使其规模与最强大的生成性 AI 语言模型相媲美。 Evo2的深度学习能力使其能够快速识别不同生物体基因序列中的模式,研究人员无需耗费数年时间。

生物版DeepSeek的隐秘竞争,中国模型被视为更强对手,赛诺菲10亿美金押宝!

编辑 | ScienceAI上周,美国斯坦福大学、英伟达等机构联合发布的生物学AI模型Evo2引起广泛关注,被誉为「生物版Deepseek」。 正当全球科研人员为这一突破性成果热议时,该论文中的特殊标注揭开了中国AI的实力——来自中国公司百图生科xTrimo系列大模型,被Evo2的研究人员列为「参数规模更大但尚未开源的竞争对手」,揭示中国生物大模型的崛起。 实际上,百图生科公司一直被美国市场认定为生命科学基础大模型的先行者,自2020年起一直前瞻性地在该领域布局。

Alphabet对AI投资加码至750亿美元 应对DeepSeek挑战

在过去的一周,Alphabet的 AI 预算似乎面临挑战,原因是中国公司 DeepSeek 的崛起,导致 Nvidia 的股票大跌。 市场对 DeepSeek 的猜测是,其更便宜的 AI 模型可能会降低对 AI 芯片和数据中心的需求。 图源备注:图片由AI生成,图片授权服务商Midjourney然而,Alphabet 首席执行官桑达尔・皮查伊在最新的财报电话会议中对 DeepSeek 给予了高度赞赏,称其工作 “极为出色”,并强调他们的 Gemini 模型同样具备高效性。