Nature回应:为什么在没有代码的情况下发布AlphaFold3?

编辑 | 枯叶蝶近期,AlphaFold3 在《Nature》杂志发布,但是它没有开源,因此引来了学界的一些争议。《Nature》官方对此做出了回应,以下为回应内容。蛋白质结构预测算法 AlphaFold 的最新迭代自发布以来,引起了人们的极大兴趣。2024 年 5 月上旬,《Nature》杂志上发表了一篇论文,介绍了 AlphaFold3。与其前身 AlphaFold2 不同,AlphaFold3 不仅可以预测蛋白质复合物的结构,还可以预测蛋白质何时与其他类型的分子(包括 DNA 和 RNA)相互作用。人工智能工

图片

编辑 | 枯叶蝶

近期,AlphaFold3 在《Nature》杂志发布,但是它没有开源,因此引来了学界的一些争议。《Nature》官方对此做出了回应,以下为回应内容。

图片

蛋白质结构预测算法 AlphaFold 的最新迭代自发布以来,引起了人们的极大兴趣。2024 年 5 月上旬,《Nature》杂志上发表了一篇论文,介绍了 AlphaFold3。

与其前身 AlphaFold2 不同,AlphaFold3 不仅可以预测蛋白质复合物的结构,还可以预测蛋白质何时与其他类型的分子(包括 DNA 和 RNA)相互作用。人工智能工具在基础研究和药物发现中都将发挥重要作用。

但它的发布也引发了对 Google DeepMind 的 AlphaFold 团队和 Nature 的质疑和批评。当年,AlphaFold2 发布时,所有研究人员都可以访问完整的底层代码。但 AlphaFold3 附带了「伪代码」——详细描述了代码的功能及其工作原理。

这不是《Nature》团队轻易做出的决定,这篇社论简要解释了理由。《Nature》团队认为,无论哪个部门从事研究,都应该通过同行评审进行评估并发表,以造福社会和科学。

与此同时,《Nature》团队也不希望这成为最终的决定。在全球大多数研究都是私人资助的情况下,这是所有研究利益相关者之间进行重要对话的机会。

社区如何使用新版本 AlphaFold 的基本原理保持不变:任何拥有 Google 帐户的人都可以免费使用该工具用于非商业应用。但最新的迭代与之前的迭代之间存在重要差异。

值得注意的是,对于 AlphaFold2,DeepMind 团队与欧洲分子生物学实验室的欧洲生物信息学研究所合作,这是一个位于英国剑桥的政府间(公共资助)研究组织。DeepMind 研究人员利用数千份已发表的蛋白质结构及其已知形状记录来训练他们的软件。

现在,DeepMind 已与 Isomorphic Labs 合作,Isomorphic Labs 是一家总部位于伦敦的药物开发公司,由谷歌母公司 Alphabet 拥有。除了无法获得完整代码之外,该工具的使用还存在其他限制——例如在药物开发中。个别研究人员每天可以执行的预测数量也有限制。

许多研究人员对这些限制感到失望。在一封致《Nature》的公开信中,其作者指出,缺乏开源代码限制了验证和再现性工作。这封信产生了影响。该模型发布后不久,DeepMind 研究副总裁 Pushmeet Kohli 在社交媒体平台 X 上发帖称,该团队「致力于在六个月内发布 AF3 模型(包括权重)供学术使用」。这是重要的一步,一旦代码发布,Nature 将更新已发表的论文。

公开信链接:go.nature.com/3k9acav

但为什么要在发布时限制完整的数据和代码呢?《Nature》杂志的编辑规则是为了支持开放科学而制定的,并规定:「作者必须立即向没有不正当资格的读者提供材料、数据、代码和相关协议。」《Nature》团队帮助研究人员实现这一目标的方法之一是与 Code Ocean 合作,Code Ocean 是一个计算科学平台,使信息可重复且可追踪。

但《Nature》团队的规则也承认可能存在限制,「必须在提交时向编辑披露」并征得编辑同意。该规则还规定:「任何妨碍代码或算法共享的原因都将由编辑进行评估,如果重要代码不可用,他们保留拒绝论文的权利。」

限制的原因包括缺乏全学科的数据报告标准或公开存储数据和结构化存储库所需的技术基础设施。在其他情况下,可能必须保护机密性,或者出于安全、安保或法律原因可能会保留数据。类似的原则也适用于代码的可用性,这就是为什么《Nature》的规则包括发布训练模型和伪代码或有限代码的选项,正如《Nature》在化学、气候变化和病毒学领域发表的研究示例所证明的那样。

私营部门为大多数全球研究和开发提供资金,此类工作的许多成果并未在同行评审的期刊上发表。《Nature》杂志团队认为,期刊与私营部门合作并与其科学家合作非常重要,这样他们就可以提交研究成果以供同行评审和出版。这促进了知识共享、研究验证以及研究人员所追求的可重复性。它还有利于产品的安全性和功效。进步需要更多而不是更少的开放数据和代码——《Nature》将继续支持这一点。

但这个目标不会一步实现。这需要一个过程。这需要所有利益相关者之间的参与和对话。

《Nature》团队重申:「我们不希望我们的意见成为最终决定,而是对话的开始。我们可以采取哪些进一步措施来确保研究生态系统中各方的开放性?我们希望听到所有利益相关者的意见——不仅来自大学和私营公司的研究人员,还来自规则制定者、非政府组织和出版商。请写信给我们。我们将使用这些页面来更新给读者。」

邮件地址:[email protected]

相关内容:https://www.nature.com/articles/d41586-024-01463-0 

相关资讯

AI 预测所有生命分子,谷歌 AlphaFold 3 模型登 Nature:欲颠覆生物学

谷歌 DeepMind 公司近日推出了 AlphaFold 3,通过预测所有生命分子是如何相互作用的,加速寻找新药和探索新的治疗方法,治疗癌症、帕金森氏症、疟疾、肺结核等疾病。IT之家从报道中获悉,AlphaFold 3 能够预测人体每个细胞分子的复杂形状,以及如何相互连接,以及其中最小的变化如何影响可能导致疾病的生物功能。科学家和医学专家希望借助 AlphaFold 3,深入研究抗体和药物的相互作用,寻找更好的治疗方法。DeepMind 创始人兼首席执行官 Demis Hassabis 表示,该项目为研究人员提供

更高准确性,覆盖蛋白、核酸、复合物等更多分子,DeepMind发布AlphaFold新版本

编辑 | ScienceAI自 2020 年发布以来,AlphaFold 彻底改变了人们对蛋白质及其相互作用的理解方式。Google DeepMind 和 Isomorphic Labs 一直在共同努力,为更强大的 AI 模型奠定基础,将覆盖范围从蛋白质扩展到全方位的生物相关分子。2023 年 10 月 31 日,该研究团队分享了下一代 AlphaFold 的最新进展。其最新的模型现在可以对蛋白质数据库 (PDB) 中的几乎所有分子进行预测,通常达到原子精度。新版模型 AlphaFold-latest (暂称)极大

AlphaFold 3 重磅问世,全面预测蛋白质与所有生命分子相互作用及结构,准确性远超以往水平

编辑 | 萝卜皮自 2021 年发布强大的人工智能 (AI) 工具 AlphaFold2 以来,科学家们一直在使用蛋白质结构预测模型来绘制细胞内各种蛋白质结构的图谱、发现药物,并绘制每种已知蛋白质相互作用的「宇宙图」。就在刚刚,Google DeepMind 发布了 AlphaFold3 模型,该模型能够对包括蛋白质、核酸、小分子、离子和修饰残基在内的复合物进行联合结构预测。AlphaFold3 的准确性对比过去许多专用工具(蛋白质-配体相互作用、蛋白质-核酸相互作用、抗体-抗原预测)有显著提高。这表明,在单个统一