NVIDIA和Arc研究所联合发布全球最大生物学 AI 模型 Evo2,助力基因组研究与设计

日前,Arc Institute 与 NVIDIA 合作,联合斯坦福大学、加州大学伯克利分校和加州大学旧金山分校的研究人员,共同推出了全球最大的生物学人工智能模型 ——Evo2。 该模型以超过128,000个基因组的数据为基础,训练了9.3万亿个核苷酸,使其规模与最强大的生成性 AI 语言模型相媲美。 Evo2的深度学习能力使其能够快速识别不同生物体基因序列中的模式,研究人员无需耗费数年时间。

日前,Arc Institute 与 NVIDIA 合作,联合斯坦福大学、加州大学伯克利分校和加州大学旧金山分校的研究人员,共同推出了全球最大的生物学人工智能模型 ——Evo2。该模型以超过128,000个基因组的数据为基础,训练了9.3万亿个核苷酸,使其规模与最强大的生成性 AI 语言模型相媲美。

QQ_1740017835097.png

Evo2的深度学习能力使其能够快速识别不同生物体基因序列中的模式,研究人员无需耗费数年时间。该模型能够准确识别引起人类疾病的突变,并有能力设计出与简单细菌基因组长度相当的新基因组。Evo2的开发团队表示,将于2025年2月19日发布该模型的详细信息,并推出名为 Evo Designer 的用户友好界面。Evo2的代码已在 Arc 的 GitHub 上公开,并已集成至 NVIDIA 的 BioNeMo 框架,以促进科学研究的进展。

相较于前代模型 Evo1,Evo2不仅扩大了数据范围,涵盖了细菌、古菌、病毒及人类、植物等真核生物的数据。研究人员表示,Evo2的开发标志着生成生物学领域的一个重要时刻,它使机器能够 “读、写、思考” 核苷酸的语言。

在技术层面,Evo2在 NVIDIA DGX Cloud AI 平台上训练,使用了2000多块 NVIDIA H100GPU,模型能够一次处理高达100万个核苷酸的基因序列,从而理解基因组的远程部分之间的关系。新的 AI 架构 “StripedHyena2” 使 Evo2能够处理比 Evo1多30倍的数据。

Evo2的应用前景广泛,例如在分析与蛋白质功能和生物体适应性相关的遗传变化方面表现出色。在乳腺癌相关基因 BRCA1的变体测试中,Evo2预测突变的准确率超过90%。这些发现能够大幅节省实验室时间和资金,推动新药的研发。

此外,Evo2还可以帮助设计新的生物工具或治疗方案。例如,科学家可以设计针对特定细胞的基因疗法,避免副作用。研究团队认为,未来可以在 Evo2的基础上构建更具体的 AI 模型,为基因组研究和生物工程提供更多可能性。

在伦理和安全风险方面,研究人员确保 Evo2的数据集不包含对人类和其他复杂生物有害的病原体,以负责任地开发和部署这一技术。

Evo2详细介绍:https://arcinstitute.org/news/blog/evo2

划重点:

🌱 Evo2是全球最大的生物学 AI 模型,训练数据涵盖128,000个基因组。  

🔍 该模型能够快速识别疾病突变并设计新基因组,大幅提高科研效率。  

💡 Evo2为未来的生物工程和基因疗法设计提供了新的可能性。

相关资讯

新一代生物AI模型Evo 2揭开基因密码,助力疾病研究

近日,由 Arc Institute 和 Nvidia 联合开发的 Evo2生物 AI 模型正式发布。 这一基础模型基于超过10万种生物的 DNA 数据,旨在深度解码生物学中的各种复杂现象。 Evo2能够在不同生物体的基因序列中识别出研究者们需要花费多年时间才能发现的模式,极大提升了疾病相关突变的识别能力,并可以设计出与简单细菌相当的全新基因组。

生物版DeepSeek的隐秘竞争,中国模型被视为更强对手,赛诺菲10亿美金押宝!

编辑 | ScienceAI上周,美国斯坦福大学、英伟达等机构联合发布的生物学AI模型Evo2引起广泛关注,被誉为「生物版Deepseek」。 正当全球科研人员为这一突破性成果热议时,该论文中的特殊标注揭开了中国AI的实力——来自中国公司百图生科xTrimo系列大模型,被Evo2的研究人员列为「参数规模更大但尚未开源的竞争对手」,揭示中国生物大模型的崛起。 实际上,百图生科公司一直被美国市场认定为生命科学基础大模型的先行者,自2020年起一直前瞻性地在该领域布局。

Nvidia与犹他州启动人工智能教育计划,培养未来AI人才

近日,Nvidia与犹他州政府宣布建立战略合作伙伴关系,共同推出全面的人工智能教育计划,旨在提升该州劳动力技能并促进经济增长。 这项公私合作将为犹他州的大学、社区学院和成人教育项目提供发展生成式人工智能技能的关键资源。 作为计划核心部分,教育工作者可通过Nvidia深度学习学院大学大使计划获得专业认证,享有高质量教学套件、研讨会内容以及云端Nvidia GPU加速工作站的访问权限。