【新智元导读】就在刚刚,陶哲轩领衔的一份 62 页报告出炉了,总结和展望了 AI 对半导体、超导体、宇宙底子物理学、生命迷信等畛域带来的巨大改变。如果这些展望在几十年后不妨完成,美国酝酿的 AI「登月计划」就将成真。
就在刚刚,陶哲轩领衔的一份 AI 技巧对全球钻研潜在影响的技巧报告发布了。
这份报告长达 62 页,总结了 AI 对质料、半导体设想、气候、物理、生命迷信等畛域已经做出的改变,以及展望它们在未来大概由 AI 产生的改变。
报告地址:
https://www.whitehouse.gov/wp-content/uploads/2024/04/AI-Report_Upload_29APRIL2024_SEND-2.pdf
除了总结 AI 东西已经改变的迷信畛域的小插曲,陶哲轩等人还发出了三个呼吁 ——
1.必须赋予人类迷信家更多的权能;
2.所有人必须负责任地利用 AI 东西;
3.国家层面必要共享基本的 AI 资本。
一旦必要的 AI 底子设施到位,新的迷信「登月计划」将成为大概
众所周知,AI—— 可以帮助钻研职员从数据中获得更多洞见,并确定最大概的解决方案;可以帮助处理日常任务,从而让钻研职员不妨专注于核心钻研;可以帮助完成实验室流程的自动化;可以帮助完成以前很难完成的模仿;可以通过多模态底子模型将多种形式的数据汇集在一起,并在不同迷信分支之间创造新的协同效应。
而当资本到位,并可以供应算力、安全的数据共享服务、开源的 AI 模型以及其他关键底子设施的访问时,我们就可以开始规划那些十分复杂且规模巨大的「登月式」科研项目。
这些项目大概包括:
– 一个模仿人类细胞复杂性的底子模型,允许在计算机上(而不是在试管或活体内),对疾病和实验性治疗进行钻研;
– 一个详细的整个地球模型,利用传统和 AI 模型来描述地球系统的组成部分,同时也不断地用高度多样化的实时数据进行更新;
– 通过系统收集、处理和 AI 辅助分析现有数据和文献,以及自动化实验室合成和测试可行的候选物,来创造实用的室温超导体。
随着共享 AI 资本底子设施的出现,全新的合作形式将从规模效应中获得实质性的好处,也就是说,随着项目规模的扩大,单位成本会降低、效率会提高。
与此同时,这种合作也可以减少不同团队之间的重复工作,提高钻研效率。
AI 即将颠覆的学科畛域
目前人类迷信发展到这个阶段,已经到达了临界点。在许多畛域,我们都面临着巨大的障碍,而这些障碍一旦能克服,这些畛域的进展都将迈入新的阶段。
令人兴奋的是,这些目前靠我们自己已经很难再推进太多的突破,靠 AI 很大概会被解决!
当然,为了完成这些设想,我们还面临一些必须考虑的潜在风险,并且还必要完成目标所需的资本。
AI 设想半导体,让美国稳坐第一
如今,支撑起全球经济和国家安全的现代电子设备,都必要依靠「芯片」来运行。
随着这些芯片功能的增强,它们的复杂性也在不断增加 —— 当前最先进的芯片,已经包含了高达数百亿个组件。
由于必要庞大的工程资本和复杂的底子设施,目前只有规模最大的公司才有能力制造这些高端芯片。而 AI 则可以在显著提升芯片设想质量的同时,减少所需的时间和人数。
当然,这些 AI 东西并不是要取代设想师,而是通过提高设想师的工作效率来帮助缓解专业芯片设想师短缺的问题。
现在,已经有很多专为芯片设想师开发的 AI 辅助东西,可以让初级设想师解决那些原本必要高级设想师花费大量时间来处理的问题。
同时,还有一些芯片设想 AI 智能体还能总结错误报告和设想文档,或者基于简单的英语提示为其他设想自动化东西生成脚本。
https://arxiv.org/pdf/2311.00176
甚至,正在开发中的 AI,还不妨设想出比传统法子更快或更小的电路.
通过利用强化进修技巧,AI 在探索大概的电路配置时会收到正面的「奖励」和负面的「惩罚」,从而使其不妨调整其设想策略,最终找到那些具有理想特性的电路设想法子。
随着半导体技巧的快速进步,每次更迭都必要重新设想数千种标准设想单元,从而适应新的制造工艺。对许多制造商而言,这一过程大概必要投入高达 80 人月的劳动力。
相比之下,结合了生成式 AI 用于数据聚类和强化进修用于纠正设想规则错误,不妨自动化这一设想过程,将所需的工作量减少超过一千倍。
论文地址:https://dl.acm.org/doi/pdf/10.1145/3569052.3578920
与此同时,FPGA 的应用使得在最新的 AI 驱动放置和布线技巧上不妨快速迭代,完成了超过三倍的效率提升。
在芯片设想的创建过程中,必须对设想进行多种分析,以确保它们符合规定的标准和制造过程的约束。
在以往,为了精确掌握「寄生」特性,必要先制作电路的布局图,这一步骤往往会使设想周期的每一次迭代增加数天的手动工作。
现在,整个设想迭代过程可以在几分钟内完成,从而快速得到符合预期规格的电路。
很快,更强大的 LLM 将会化身成「芯片设想助手」—— 它们不仅能回答问题、评估和验证设想,还能执行一些常规设想任务。
此外,AI 技巧将极大提升设想师的工作效率,大概增加十倍甚至更多。设想师只需把自己的注意力集中在算法和系统层面,而更细节的设想层面交给 AI 就可以了。
而且,AI 的合成与分析东西将极大缩短设想周期,使得从高层次的设想描述到完成验证的布局只需几小时,而现在这一过程必要几周时间。
PCAST 预计,通过将这些前沿技巧融入芯片制造过程,美国将继续保持在半导体设想畛域的领先地位,并有效缓解该畛域的严重劳动力短缺问题。
甚至完成美国半导体行业的宏伟目标 —— 开发出全新的平台、法子和东西,使得芯片的生产只需现在所需人力的十分之一。
揭示宇宙的底子物理学:1 分钟模仿超算的 1 个月
关于宇宙,这些谜题始终未曾解答。
是什么「暗物质」将星系结合在一起?
又是什么「暗能量」推动所有星系间的距离加速膨胀?
最近观测到的那些古老的星系,有什么意义?
这些对于宇宙的底子理解,却能让我们完成技巧上的飞跃。
比如,大概我们很难想象出一个比广义相对论更抽象、更不切实际的底子理论了,然而,它却是全球定位系统 GPS 的底子,解决了我们此前从未预想到的定位和导航问题,而其中的经济利益,以千亿美元计。
而如今,对于 AI 已经成为物理学家和宇宙学家实验和观测中工作中的重要东西,用于设想、完成和分析大多数步骤。
某些对 AI 的应用建立在目前的法子上,通过计算模仿,来比较和测试理论与数据,比如如果一个理论是正确的,数据看起来会是什么样。
▲ 通过条件密度估计对新物理学进行无监督分布内异常检测
对于超级计算机,这些模仿大概是最困难的任务,因为它们必要计算每一个粒子、恒星或星系行为的每一步。
但 AI 的好处是,它可以从这些模仿中进修更大的模型。这样,迷信家就可以缩短这些超算的任务,让它不妨在不到一分钟的时间内,看到一台超算一个月工作量的近似值。
通过 AI,钻研职员可以扫描数百万种大概的理论,每一种都有我们字宙的不同初始图像,他们就能看到,哪一种更能解释我们实际用望远镜观察到的数据。
而到 2030 年末,我们就能用 AI 分析 Nancy Grace Roman 望远镜十年的数据。
▲ Nancy Grace Roman 太空望远镜
通过 AI 对数据进行分析,迷信家们很大概会创造惊人的证据,证明我们的字宙不会在指数膨胀的冷寂中终结,而是会重复地发生大爆炸,循环重启。
AI 具有在复杂数据集中创造模式的能力,变量的数量远超人类可以跟踪的数量。
如果有新创造打破了常规规律,就会脱颖而出。
已经有粒子物理学家举办过比赛,来寻找搜索这些「异常」的最佳法子,后者很大概指向新的物理创造。而比赛的获胜者都是基于 AI 做出的创造。
▲ 通过拉格朗日深度进修生成宇宙流体动力学的有效物理定律,在混合模仿中展望暗物质超密度、恒星质量、电子动量密度等
这些 AI 法子,很大概使我们在下一代 CERN 和费米实验室加速器实验中,创造一些极其罕见、意想不到的粒子,这将有助于构建统一理论,该理论将引力与其他力相结合。
底子物理学和宇宙学,都是基于对数据进行统计分析,因此必要深入了解数据解释中的概率,这一要求也推动了 AI 在处理概率严谨性上的发展。
因为,我们必要 AI 做的,不仅是供应最有大概的答案 (「那是一张猫的照片」),而是开发不妨供应一系列大概答案、并且供应每个答案正确大概性的 AI 系统 (「有 69% 的大概性那是一只猫,22% 的大概性是土豚,8% 的大概性是气球,百分之一的大概性是冰箱」)。
▲ 物理学家正在寻找一种将量子物理学与广义相对论统一起来的理论
对于一个关键数字的测量,它会给出一组大概值,例如 68%、95% 或 99.9% 的概率。
评估不确定性,对于底子物理学至关重要,而严格遵循概率的 AI,也将为许多其他迷信畛域带来变革,对于迷信意外的应用也意义重大。
或许 20 年后,迷信家会用 AI 看到量子计算机与黑洞之间的类比,开启一种全新的测试广义相对论的台式法子,以及一种强大的新时序技巧。
新质料:超导体、冷原子、拓扑绝缘体、超导量子比特
曾经,人类生活质量的重大改善,是由青铜、铁、混凝土、钢这些质料迷信的进步推动的。
今天,我们生活在硅、碳氢化合物和硝酸盐的时代。不久的将来,大概就是纳米质料、生物聚合物和量子质料的时代。
而 AI 的辅助,会打开许多以往只存在于想象中的大概,包括室温超导、大规模量子计算机架构。
▲ 机器人正在劳伦斯伯克利国家实验室的 A-Lab 中合成质料
如今,迷信家已经成功地用深度进修模型创造了多种质料。
比如,某私营公司的跨学科钻研团队,利用 AI 设想出了数百万种新质料,近半数 AI 展望出来的新质料,都具备足够的稳定性,可以在实验室中生长。
另外,AI 也可用于改进现有质料,优化质料成分,减少对环境有害的物质。
▲ 用于展望质料拓扑性质的密度泛函理论示例
为了设想和开发新质料,来解决重大的社会挑战,美国国家迷信基金会 (NSF) 已经投资了 7250 万美元。
具体来说,以下几个遇到阻碍的质料畛域,很有望被 AI 解决。
超导体
去年夏天的室温超导热,让全社会都感受到了奇点临近的兴奋。
对于磁共振成像仪、粒子加速器、某些实验性的量子计算技巧、全国电力网来说,超导体都是必不可少的,因为它不妨无损耗地传输电能。
然而,超导体面临三个问题。
第一,就是目前已知的超导体必须冷却到接近绝对零度,也即零下 273 摄氏度,这就必要利用液氮,导致设备极其昂贵。
第二,与铜等传统导体不同,现有的超导体并不具有可塑性,会随着时间失去超导性。
第三,前驱质料的成本,还是加工成导线的成本,也都十分昂贵。
从前,我们的尝试都是依赖组合化学法子,必要筛选大量的质料组合。
▲ 为了得到常温常压超导,人类已经努力了 100 多年
因此,许多至关重要的质料的创造,都是出于偶然,期间经历了大量试验和错误。
变量如此之多,让质料价格低廉的要求如此之难,使得超导体的创造几乎不大概用传统法子解决。
而 AI,将在 3 个畛域带来改变。
首先,AI 模型展望能力,使我们不妨通过连接并利用现有质料、处理条件和性能方面的大量数据,来创造新质料。
从这个数据集中,可以确定化学、物理和工程中质料的模式,为钻研职员供应新法子。
▲ 基于 GNoME 的创造,显示了基于模型的过滤和 DFT 如何充当数据飞轮,来改进展望
其次,人工智能模型可以展望性能(例如,展望量子比特的相于时间、热电质料的效率或超导体的临界温度),从而减少对可行候选质料实验的测试的浪费。
第三,通过将过程信息与质料组成相结合,可以在质料设想方面设定实际限制,加快新质料应用的商业化过程。
除了超导体这种「硬」质料,聚合物、流体这些「软」质料,因为质料迷信中复杂的结构-性能关系,同样必要庞大的数据级和展望能力。
而且,量子计算机的基本构建部分,如冷原子、拓扑绝缘体或超导量子比特,都可以靠 AI 改进或生成。
▲ 具有 4 个量子比特的超导芯片
生命迷信
美国国家迷信技巧委员会认为,由 AI 驱动的东西、分析和结果,将从根本上改变我们探索和理解生命的基本组成部分的方式,还会影响到包括农业和医学的生命系统。
揭开细胞功能之谜
解读细胞内部复杂的运作机制,是几个世纪以来一直困扰生物学家的难题,因为细胞的结构极其复杂且互相关联。
而 AI 就为此供应了强大的东西。
比如,AI 为蛋白质供应了新的视角。
基于 AI 的蛋白质折叠展望系统,可以利用机器进修算法展望了数百万种蛋白质的结构。
▲ 基于大规模深度进修的结构建模范围从单体蛋白质扩展到蛋白质组装
这些系统从已知蛋白质和结构的数据中进修,也从底子化学知识如原子间距离的物理约束中进修。
最近,钻研职员还利用 AI 来破解蛋白质的功能,包括蛋白质如何相互作用,从而揭示细胞信号转导、代谢和基因调控等分子机制。
人工智能东西也被用来设想蛋白质,以完成与受体和其他目标特异性结合的目标。
AI 驱动的蛋白质设想,已经在开发疫苗和新型药物方面取得了成功。其中一些设想法子,正是利用了「扩散模型」和图像生成系统的填充和描边技巧。
▲ 利用三轨神经网络准确展望蛋白质结构和相互作用
构建生物迷信底子模型
构建生物信息学仿真东西,一个很有潜力的法子是构建面向整体细胞建模的多模态、多层次生物迷信底子模型。
AI 法子使迷信家不妨对多种类型的数据进行多模态表征,或者「嵌入」,包括蛋白质序列和结构、DNA、RNA 表达数据、临床观察、成像数据和来自电子健康记录的数据等。
▲ 利用 RFAA 进行一般生物分子建模
例如,开发集成大型数据集的底子模型 EVO,结合 DNA、RNA 和蛋白质数据,来阐明细胞整体功能背后的相互作用。
这种多模态、多层次的模型,可以供应从原子到生理学的各种尺度的结果展望,以及分子和行为的生成。
生物迷信底子模型,有望使迷信家探究健康与疾病的本质,例如建立癌症模型,并探索细胞相互作用,以及癌症背后的网络如何在模仿中被破坏或「治愈」。
AI 将指导药物研发,在开始昂贵耗时的实验之前,AI 就可以通过虚拟筛选潜在的治疗化合物,减少不必要的浪费。
五点建议
为了完成以上技巧进步,PACST 委员会提出了以下五点建议。
建议 1:广泛公平地共享底子 AI 资本
广泛支持易于访问的共享模型、数据集、基准和计算能力,对于确保学术钻研职员、国家和联邦实验室以及较小的公司和非营利组织不妨利用 AI 为国家创造利益至关重要。
在美国,最有希望的一个试点项目是 —— 国家人工智能钻研资本(NAIRR),PCAST 建议尽快将 NAIRR 扩展到特别工作组设想的规模,并获得全额赞助。
完整规模的 NAIRR,连同行业合作伙伴关系以及联邦和州的其他 AI 底子设施,可以作为美国或国际层面 AI 底子设施项目的基石,从而促进高影响力的钻研。
建议 2:扩大对联邦数据集的安全访问
PCAST 强烈建议扩大现有的安全数据访问试点计划,并制定联邦数据库管理指南,从而加入入最先进的隐私保护技巧。
这包括允许获批的钻研职员有限度、安全地访问联邦数据集,以及允许向 NAIRR 等资本中心发布经过匿名化处理的数据集。
此外,PCAST 还希望能进一步执行此类授权,包括共享在联邦赞助的钻研数据上训练的 AI 模型,并供应足够的资本来支持所需的行动。
建议 3:支持 AI 畛域的底子和应用钻研,其中包括学术界、工业界、国家和联邦实验室以及联邦机构之间的合作
联邦赞助的学术钻研与私营部门钻研之间的界限是模糊的。许多钻研职员会在学术机构、非营利组织和私营公司之间流动。在这之中,私营公司目前支持了相当大比例的 AI 研发。
为了不妨充分利用 AI 在迷信畛域的潜在优势,就必须支持各种有前景、有成果的假设和法子的钻研。
因此,赞助机构必要在如何与产业界合作以及哪些钻研职员可以得到支持方面放宽姿态,以便促进创新钻研以及不同部门之间的协作。
建议 4:在迷信钻研过程的所有阶段采用负责任、透明和值得信赖的 AI 利用原则
在迷信钻研中,利用 AI 大概会产生不准确、有偏见、有害或无法复现的结果。因此,从项目的初始阶段,就应该对这些风险进行管理。
PCAST 建议,联邦赞助机构可以更新其负责任钻研行为准则,要求钻研职员供应负责任的 AI 利用计划。为了最大限度地减轻钻研职员的额外行政负担,在列举主要风险后,机构应供应风险缓解的示范流程。
与此同时,国家迷信基金会(NSF)和国家标准与技巧钻研所(NIST)等机构应继续支持负责任和值得信赖的 AI 的迷信底子钻研。
其中包括,衡量 AI 准确性、可重复性、公平性、弹性和可解释性等属性的标准基准;监测这些属性并在基准不在定义范围内时进行调整的 AI 算法;以及评估数据集中的偏差,并区分合成数据和真实世界数据的东西。
建议 5:鼓励采用创新法子将 AI 辅助集成到迷信工作流程之中
迷信事业是一个很好的「沙盒」,我们可以在其中练习、钻研和评估人与 AI 助手之间新的协作范式。
不过,这里的目标并不是追求自动化程度的最大化,而是要让人类钻研职员在负责任地利用 AI 辅助的同时,完成高质量的迷信钻研。
赞助机构应该重视这些新工作流的出现,并设想灵活的程序、评估指标、赞助模式和挑战性问题,鼓励以新的 AI 辅助方式组织和执行迷信项目的战略性实验。
此外,这些工作流的实施也为来自各个学科的钻研职员供应了机会,从而推进了在人机协作畛域的知识。
更广泛地说,我们还必要更新赞助机构、学术界和学术出版业的激励机制,来支持更广泛的迷信贡献。比如,策划高质量和广泛可用的数据集,是无法通过传统钻研生产力指标得到充分认可的。
参考资料:
https://mathstodon.xyz/@tao/112355788324104561
本文来自微信公众号:新智元 (ID:AI_era)