倾斜 AI-物理模型示意图。
编辑 | X
人工智能(AI)迅速发展,大模型正在重新定义我们明白和应对景象应战的方式。AI 模型已经席卷了大气迷信的各个领域。
今年年初,中国迷信院大气物理研究所黄刚研究员团队将物理与 AI 融合,提升了数值形式的降水预报技巧。
近日,黄刚团队联合中国迷信院大学、青岛海洋迷信与技术国家实验室、同济大学和首尔国立大学在《Advances in Atmospheric Sciences》上,发表了题为「Toward a Learnable Climate Model in the Artificial Intelligence Era」的观点文章。
观点表明,景象建模的未来涉及 AI 和物理学之间的协同关系,而不是「非此即彼」的场景。仔细审视大型 AI 模型中当前物理不一致的争议,夸大了对详细静态诊疗和物理束缚的迫切需要。此外,还供给了说明性示例来指导 AI 模型的未来评价和束缚。
关于 AI 与数值模型的集成,作者认为离线 AI 参数化计划可能无法实现全局最优,夸大构建在线计划的重要性。此外,夸大培养社区文化的重要性,并提出 OCR(凋谢、可比、可重现)准则。
总之,通过将 AI 的空间能力与物理学的基本原理相结合,并建立一个协作社区,研究人员的目标是实现一个将 AI 和物理学无缝融合的景象模型,这代表着景象迷信向前迈出了重要一步。
论文链接:https://link.springer.com/article/10.1007/s00376-024-3305-9
AI 迅速发展,已经在大气迷信的各个领域产生了深远影响,特别是盘古天色(Pangu-Weather)和 GraphCast 等大型 AI 天色模型的引入。然而,随着这些进步,关于这些模型与基本物理原理的一致性的问题也出现了。
先前的研究表明,盘古天色可以通过定性分析准确地复制某些景象形式,例如热带吉尔反应和热带外遥相关。然而,定量研究表明,当前 AI 天色模型中的风成分存在显著差异,例如发散风和地转风。尽管有这些发现,仍然有人担心物理学在景象迷信中的重要性有时会被忽视。
AI 在景象迷信领域的崛起
AI 模型已经席卷了大气迷信的大部分领域,包括但不限于天色预报、次季节和季节性预测、极端天色和景象预测、参数化计划、模型模拟校正以及景象检测和归因。
AI 凭借其整合和明白卫星、气象站和海洋浮标等多种来源的数据的能力,在许多领域取得了突破性的进步。其优势在于增强对大气系统的整体明白,处理大气动力学的复杂性和非线性,并供给快速的计算速度。
表 1:大型 AI 天色模型的详细信息。(来源:论文)
尽管 AI 蓬勃发展,但通常被描述为景象迷信基石的物理学的作用有时却被掩盖了。物理定律和景象理论供给了支撑我们明白景象系统的基本准则。它们构成了静态景象模型的基础,为景象预测和景象模拟供给了一个易于明白的框架。这些模型是可解释的。
然而,在 AI 时代,可解释性往往退居二线。AI 模型通常被认为是「黑匣子」,它生成预测和模拟,但没有透明地解释其所涉及的物理过程。在验证 AI 模型和建立对其生成结果的信任时,这种不透明性带来了巨大的应战。
此外,缺乏物理束缚的 AI 模型常常面临泛化能力差等问题。这可能导致结果与物理特性不一致并且高度不稳定,特别是在极端事件的情况下。
那么,我们该何去何从?答案在于 AI 和物理学之间的共生关系。AI 带来了无与伦比的计算能力和识别复杂形式的能力,而物理学则供给了透明度、可解释性和迷信明白的坚实基础。景象建模的未来不是一个「非此即彼」的场景,而是这两个领域之间的合作伙伴关系,利用 AI 的计算能力和物理定律的基础,来创建一个具有良好可解释性的可进修的景象模型。
AI 建模的物理学:局限性和解决计划
最近出现的大型 AI 天色模型已经开始与传统的数值天色预报相媲美或超越。这自然引发了这样的问题:这些 AI 模型是否遵循气象和景象理论的准则。
「定性评价发现,AI 模型可以明白和进修天色和景象数据的空间形式。另一方面,定量方法凸显了一个局限性:当前的 AI 模型很难进修某些风形式,而是仅仅依赖于总风速。」 中国迷信院大气物理研究所黄刚教授解释道。
「这夸大了对 AI 模型进行全面静态诊疗的必要性。只有通过整体分析,我们才能增强我们的明白,并施加必要的物理束缚。」
这些束缚可以分为软束缚和硬束缚。软束缚并不明确地强加特定的网络变化,而是供给物理链接、物理方程或数学束缚的一些表示。它们可能包含不同区域之间的联系,例如遥相关或不同变量之间的相互作用。同时,硬束缚通常会修改神经网络,确保进修和推理过程中的预期束缚。
AI 数值建模:局限性和解决计划
AI在景象模型中的应用正不断增强,特别是在构建参数化计划方面,以提高数值模型的性能。
然而,当前的 AI 参数化计划仍然存在应战。首先,目前大多数 AI 参数化计划都处于离线状态。可能会导致模型不稳定,并可能引发景象漂移等各种问题。其次,针对给定参数化计划单独对特定参数进行深度进修优化的目的是实现该参数的最佳值。实际上,景象模型具有众多参数,优化一个参数可能仅代表整个模型的局部最优。
一个潜在的解决计划是开发在线参数化计划,通过比较数值模型输出和观测数据来计算损失,并使用反向传播优化 AI 权重。
最近,谷歌的神经通用循环模型(NGCM)展示了 AI-物理混合 GCM 的在线性能,与主流模型相比表现出色,并严格遵循物理守恒定律。尽管取得了进展,但构建可比较的景象模型仍然具有应战性。
景象界的基础设施
研究人员认识到社区协作的重要性,因此提倡凋谢性、可比性和可重复性 (OCR) 文化。通过接受类似于 AI 和计算机迷信界的准则,他们相信培养一种有利于开发真正可进修的景象模型的文化。
图示:OCR 准则。(来源:论文)
「凋谢」(Open):夸大 AI 景象建模的开源代码和凋谢数据集。
「可比」(Comparable):是指建立统一的评价指标。它涉及整合景象模型评价框架来进行全面的评价,包括景象静态评价以及建立统一的数据集、任务集和基线。
「可重现」(Reproducible):是指研究论文中发表的结果应该是可重现的。
OCR 准则之间存在微妙的相互作用和相互影响。「凋谢」是后续准则得以实现的基础。「可比」和「可重复」是相辅相成、共生的。AI 模型结果的「可重现」部分对于比较不同模型的输出至关重要。这反过来又提高了迷信家对模型可重复性的认识和重视,创建了一个和谐的框架,推动迷信研究迈向更可靠、更持久的进步。
建立倾斜的 AI-物理景象模型
展望未来,更全面的静态诊疗和物理束缚可以进一步增强 AI 景象模型的性能。这一进展也将刺激 AI 参数化计划的发展。
考虑到 AI 和数值景象模型的发展,人们乐观地认为景象模型输出与观测结果之间存在差异的应战可以得到解决。AI 和数值景象模型之间的倾斜是可以实现的。这种倾斜可能涉及使用数值方法来解决可解过程,同时使用在线 AI 解决计划来解决关键参数化计划。
随着这种混合方法的进步,将模型分类为纯数字模型或基于 AI 的模型变得越来越具有应战性。最终,它演变成一个倾斜的 AI-物理景象模型。
通过结合基于 AI 的参数化计划,这样的模型可以迭代优化,转变为可进修的景象模型。此外,由于它包括物理量的显式计算并遵循物理方程,因此该模型表现出高水平的可解释性,保证了直接的景象诊疗分析。
参考内容:https://phys.org/news/2024-04-ai-physics-learnable-climate.htm