平衡 AI-物理模型示意图。
编辑 | X
人工智能(AI)迅速发展,大模型正在重新定义我们理解和应对气候挑战的方式。AI 模型已经席卷了大气科学的各个领域。
今年年初,中国科学院大气物理研究所黄刚研究员团队将物理与 AI 融合,提升了数值模式的降水预报技巧。
近日,黄刚团队联合中国科学院大学、青岛海洋科学与技术国家实验室、同济大学和首尔国立大学在《Advances in Atmospheric Sciences》上,发表了题为「Toward a Learnable Climate Model in the Artificial Intelligence Era」的观点文章。
观点表明,气候建模的未来涉及 AI 和物理学之间的协同关系,而不是「非此即彼」的场景。仔细审视大型 AI 模型中当前物理不一致的争议,强调了对详细动态诊断和物理约束的迫切需要。此外,还提供了说明性示例来指导 AI 模型的未来评估和约束。
关于 AI 与数值模型的集成,作者认为离线 AI 参数化方案可能无法实现全局最优,强调构建在线方案的重要性。此外,强调培养社区文化的重要性,并提出 OCR(开放、可比、可重现)原则。
总之,通过将 AI 的空间能力与物理学的基本原理相结合,并建立一个协作社区,研究人员的目标是实现一个将 AI 和物理学无缝融合的气候模型,这代表着气候科学向前迈出了重要一步。
论文链接:https://link.springer.com/article/10.1007/s00376-024-3305-9
AI 迅速发展,已经在大气科学的各个领域产生了深远影响,特别是盘古天气(Pangu-Weather)和 GraphCast 等大型 AI 天气模型的引入。然而,随着这些进步,关于这些模型与基本物理原理的一致性的问题也出现了。
先前的研究表明,盘古天气可以通过定性分析准确地复制某些气候模式,例如热带吉尔反应和热带外遥相关。然而,定量研究表明,当前 AI 天气模型中的风成分存在显著差异,例如发散风和地转风。尽管有这些发现,仍然有人担心物理学在气候科学中的重要性有时会被忽视。
AI 在气候科学领域的崛起
AI 模型已经席卷了大气科学的大部分领域,包括但不限于天气预报、次季节和季节性预测、极端天气和气候预测、参数化方案、模型模拟校正以及气候检测和归因。
AI 凭借其整合和理解卫星、气象站和海洋浮标等多种来源的数据的能力,在许多领域取得了突破性的进步。其优势在于增强对大气系统的整体理解,处理大气动力学的复杂性和非线性,并提供快速的计算速度。
表 1:大型 AI 天气模型的详细信息。(来源:论文)
尽管 AI 蓬勃发展,但通常被描述为气候科学基石的物理学的作用有时却被掩盖了。物理定律和气候理论提供了支撑我们理解气候系统的基本原则。它们构成了动态气候模型的基础,为气候预测和气候模拟提供了一个易于理解的框架。这些模型是可解释的。
然而,在 AI 时代,可解释性往往退居二线。AI 模型通常被认为是「黑匣子」,它生成预测和模拟,但没有透明地解释其所涉及的物理过程。在验证 AI 模型和建立对其生成结果的信任时,这种不透明性带来了巨大的挑战。
此外,缺乏物理约束的 AI 模型常常面临泛化能力差等问题。这可能导致结果与物理特性不一致并且高度不稳定,特别是在极端事件的情况下。
那么,我们该何去何从?答案在于 AI 和物理学之间的共生关系。AI 带来了无与伦比的计算能力和识别复杂模式的能力,而物理学则提供了透明度、可解释性和科学理解的坚实基础。气候建模的未来不是一个「非此即彼」的场景,而是这两个领域之间的合作伙伴关系,利用 AI 的计算能力和物理定律的基础,来创建一个具有良好可解释性的可学习的气候模型。
AI 建模的物理学:局限性和解决方案
最近出现的大型 AI 天气模型已经开始与传统的数值天气预报相媲美或超越。这自然引发了这样的问题:这些 AI 模型是否遵循气象和气候理论的原则。
「定性评估发现,AI 模型可以理解和学习天气和气候数据的空间模式。另一方面,定量方法凸显了一个局限性:当前的 AI 模型很难学习某些风模式,而是仅仅依赖于总风速。」 中国科学院大气物理研究所黄刚教授解释道。
「这强调了对 AI 模型进行全面动态诊断的必要性。只有通过整体分析,我们才能增强我们的理解,并施加必要的物理约束。」
这些约束可以分为软约束和硬约束。软约束并不明确地强加特定的网络变化,而是提供物理链接、物理方程或数学约束的一些表示。它们可能包含不同区域之间的联系,例如遥相关或不同变量之间的相互作用。同时,硬约束通常会修改神经网络,确保学习和推理过程中的预期约束。
AI 数值建模:局限性和解决方案
AI在气候模型中的应用正不断增强,特别是在构建参数化方案方面,以提高数值模型的性能。
然而,当前的 AI 参数化方案仍然存在挑战。首先,目前大多数 AI 参数化方案都处于离线状态。可能会导致模型不稳定,并可能引发气候漂移等各种问题。其次,针对给定参数化方案单独对特定参数进行深度学习优化的目的是实现该参数的最佳值。实际上,气候模型具有众多参数,优化一个参数可能仅代表整个模型的局部最优。
一个潜在的解决方案是开发在线参数化方案,通过比较数值模型输出和观测数据来计算损失,并使用反向传播优化 AI 权重。
最近,谷歌的神经通用循环模型(NGCM)展示了 AI-物理混合 GCM 的在线性能,与主流模型相比表现出色,并严格遵循物理守恒定律。尽管取得了进展,但构建可比较的气候模型仍然具有挑战性。
气候界的基础设施
研究人员认识到社区协作的重要性,因此提倡开放性、可比性和可重复性 (OCR) 文化。通过接受类似于 AI 和计算机科学界的原则,他们相信培养一种有利于开发真正可学习的气候模型的文化。
图示:OCR 原则。(来源:论文)
「开放」(Open):强调 AI 气候建模的开源代码和开放数据集。
「可比」(Comparable):是指建立统一的评价指标。它涉及整合气候模型评估框架来进行全面的评估,包括气候动态评估以及建立统一的数据集、任务集和基线。
「可重现」(Reproducible):是指研究论文中发表的结果应该是可重现的。
OCR 原则之间存在微妙的相互作用和相互影响。「开放」是后续原则得以实现的基础。「可比」和「可重复」是相辅相成、共生的。AI 模型结果的「可重现」部分对于比较不同模型的输出至关重要。这反过来又提高了科学家对模型可重复性的认识和重视,创建了一个和谐的框架,推动科学研究迈向更可靠、更持久的进步。
建立平衡的 AI-物理气候模型
展望未来,更全面的动态诊断和物理约束可以进一步增强 AI 气候模型的性能。这一进展也将刺激 AI 参数化方案的发展。
考虑到 AI 和数值气候模型的发展,人们乐观地认为气候模型输出与观测结果之间存在差异的挑战可以得到解决。AI 和数值气候模型之间的平衡是可以实现的。这种平衡可能涉及使用数值方法来解决可解过程,同时使用在线 AI 解决方案来解决关键参数化方案。
随着这种混合方法的进步,将模型分类为纯数字模型或基于 AI 的模型变得越来越具有挑战性。最终,它演变成一个平衡的 AI-物理气候模型。
通过结合基于 AI 的参数化方案,这样的模型可以迭代优化,转变为可学习的气候模型。此外,由于它包括物理量的显式计算并遵循物理方程,因此该模型表现出高水平的可解释性,保证了直接的气候诊断分析。
参考内容:https://phys.org/news/2024-04-ai-physics-learnable-climate.htm