Nature回应:为什么在没有代码的情况下公布AlphaFold3?

编纂 | 枯叶蝶近期,AlphaFold3 在《Nature》杂志公布,但是它没有开源,因此引来了学界的一些争议。《Nature》官方对此做出了回应,以下为回应内容。蛋白质结构预计算法 AlphaFold 的最新迭代自公布以来,引起了人们的极大兴趣。2024 年 5 月上旬,《Nature》杂志上宣布了一篇论文,介绍了 AlphaFold3。与其前身 AlphaFold2 不同,AlphaFold3 不仅可以预计蛋白质复合物的结构,还可以预计蛋白质何时与其他类型的分子(包括 DNA 和 RNA)相互作用。人工智能工

Nature回应:为什么在没有代码的情况下公布AlphaFold3?

编纂 | 枯叶蝶

近期,AlphaFold3 在《Nature》杂志公布,但是它没有开源,因此引来了学界的一些争议。《Nature》官方对此做出了回应,以下为回应内容。

Nature回应:为什么在没有代码的情况下公布AlphaFold3?

蛋白质结构预计算法 AlphaFold 的最新迭代自公布以来,引起了人们的极大兴趣。2024 年 5 月上旬,《Nature》杂志上宣布了一篇论文,介绍了 AlphaFold3。

与其前身 AlphaFold2 不同,AlphaFold3 不仅可以预计蛋白质复合物的结构,还可以预计蛋白质何时与其他类型的分子(包括 DNA 和 RNA)相互作用。人工智能工具在基础钻研和药物发现中都将发挥紧张作用。

但它的公布也引发了对 Google DeepMind 的 AlphaFold 团队和 Nature 的质疑和批评。当年,AlphaFold2 公布时,所有钻研职员都可以访问完整的底层代码。但 AlphaFold3 附带了「伪代码」——详细描述了代码的功能及其工作原理。

这不是《Nature》团队轻易做出的决定,这篇社论简要解释了理由。《Nature》团队认为,无论哪个部门从事钻研,都应该通过同业评审进行评估并宣布,以造福社会和科学。

与此同时,《Nature》团队也不希望这成为最终的决定。在全球大多数钻研都是私人资助的情况下,这是所有钻研利益相关者之间进行紧张对话的机会。

社区如何应用新版本 AlphaFold 的基本原理保持不变:任何拥有 Google 帐户的人都可以免费应用该工具用于非商业应用。但最新的迭代与之前的迭代之间存在紧张差异。

值得注意的是,对于 AlphaFold2,DeepMind 团队与欧洲分子生物学实验室的欧洲生物信息学钻研所协作,这是一个位于英国剑桥的政府间(公共资助)钻研组织。DeepMind 钻研职员利用数千份已宣布的蛋白质结构及其已知形状记录来训练他们的软件。

现在,DeepMind 已与 Isomorphic Labs 协作,Isomorphic Labs 是一家总部位于伦敦的药物开发公司,由谷歌母公司 Alphabet 拥有。除了无法获得完整代码之外,该工具的应用还存在其他局限——例如在药物开发中。个别钻研职员每天可以执行的预计数量也有局限。

许多钻研职员对这些局限感到失望。在一封致《Nature》的公开信中,其作者指出,缺乏开源代码局限了验证和再现性工作。这封信产生了影响。该模型公布后不久,DeepMind 钻研副总裁 Pushmeet Kohli 在社交媒体平台 X 上发帖称,该团队「致力于在六个月内公布 AF3 模型(包括权重)供学术应用」。这是紧张的一步,一旦代码公布,Nature 将更新已宣布的论文。

公开信链接:go.nature.com/3k9acav

但为什么要在公布时局限完整的数据和代码呢?《Nature》杂志的编纂法规是为了支持开放科学而制定的,并规定:「作者必须立即向没有不正当资格的读者提供材料、数据、代码和相关协议。」《Nature》团队帮助钻研职员实现这一目标的方法之一是与 Code Ocean 协作,Code Ocean 是一个计算科学平台,使信息可重复且可追踪。

但《Nature》团队的法规也承认可能存在局限,「必须在提交时向编纂披露」并征得编纂同意。该法规还规定:「任何妨碍代码或算法共享的原因都将由编纂进行评估,如果紧张代码不可用,他们保留拒绝论文的权利。」

局限的原因包括缺乏全学科的数据报告标准或公开存储数据和结构化存储库所需的技术基础设施。在其他情况下,可能必须保护机密性,或者出于安全、安保或法律原因可能会保留数据。类似的原则也适用于代码的可用性,这就是为什么《Nature》的法规包括公布训练模型和伪代码或有限代码的选项,正如《Nature》在化学、气候变化和病毒学领域宣布的钻研示例所证明的那样。

私营部门为大多数全球钻研和开发提供资金,此类工作的许多成果并未在同业评审的期刊上宣布。《Nature》杂志团队认为,期刊与私营部门协作并与其科学家协作非常紧张,这样他们就可以提交钻研成果以供同业评审和出版。这促进了知识共享、钻研验证以及钻研职员所追求的可重复性。它还有利于产品的安全性和功效。进步需要更多而不是更少的开放数据和代码——《Nature》将继续支持这一点。

但这个目标不会一步实现。这需要一个过程。这需要所有利益相关者之间的参与和对话。

《Nature》团队重申:「我们不希望我们的意见成为最终决定,而是对话的开始。我们可以采取哪些进一步措施来确保钻研生态系统中各方的开放性?我们希望听到所有利益相关者的意见——不仅来自大学和私营公司的钻研职员,还来自法规制定者、非政府组织和出版商。请写信给我们。我们将应用这些页面来更新给读者。」

邮件地址:[email protected]

相关内容:https://www.nature.com/articles/d41586-024-01463-0 

给TA打赏
共{{data.count}}人
人已打赏
应用

第一个 iPhone 刺客,倒下了

2024-5-23 18:49:00

应用

赛诺菲与OpenAI、Formation Bio竞争,减速AI药物发现

2024-5-23 19:01:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索