AI 猜测蝴蝶效应?google最新气象预告模型 SEEDS 登 Science 子刊

新智元报道  编辑:Mindy【新智元导读】气象本质上是随机的,为了量化不确定性,保守要领通常必要高昂的成本来物理摹拟大量猜测。google最新研究登 Science 子刊,用生成式 AI 模型高效生成规模化的气象预告汇合,为气象和气象科学开辟了新的机会。1972 年 12 月,在美国华盛顿特区举行的美国科学促进会年会上,麻省理工学院气象学教授埃德・洛伦兹发表了题为「巴西一只蝴蝶的扇动是否会在得克萨斯引发龙卷风?」的演讲,这贡献了「蝴蝶效应」这一术语。在他 1963 年的一篇论文中,他发现在时间积分与数值气象猜测模型里,即

AI 猜测蝴蝶效应?google最新气象预告模型 SEEDS 登 Science 子刊

  新智元报道  

编辑:Mindy

【新智元导读】气象本质上是随机的,为了量化不确定性,保守要领通常必要高昂的成本来物理摹拟大量猜测。google最新研究登 Science 子刊,用生成式 AI 模型高效生成规模化的气象预告汇合,为气象和气象科学开辟了新的机会。

1972 年 12 月,在美国华盛顿特区举行的美国科学促进会年会上,麻省理工学院气象学教授埃德・洛伦兹发表了题为「巴西一只蝴蝶的扇动是否会在得克萨斯引发龙卷风?」的演讲,这贡献了「蝴蝶效应」这一术语。

在他 1963 年的一篇论文中,他发现在时间积分与数值气象猜测模型里,即使微小的起始条件缺点,也会在数值模型中迅速扩大,导致猜测结果的不确定性迅速增加,这被称为混沌现象。

因此,气象预告的可靠性受到了限制,尤其是在极其气象事变的猜测方面,比如飓风、热浪或洪水。

出于上述原因,目前的气象预告其实都是几率预告。

这些预告使用了一种叫做汇合预告的要领,通过在初始条件中引入一些随机性,然后运行多个不同的模型来生成多种可能的结果。

通过对汇合中的所有预告进行平均处理来减少缺点增长,并且汇合中的预告的变化量量化了气象条件的不确定性。

尽管有效,生成这些几率预告的计算成本很高。它们必要在大规模超级计算机上多次运行高度复杂的数值气象模型。

尤其是极其气象,通常必要更大的汇合来评估。例如,为了猜测发生几率为 1% 的事变的可能性,必要一个包含 1 万个成员的汇合,且相对缺点小于 10%。

但精确和及时的气象预告,是人们日常生活所必需的。从准备一天的活动必要带什么出门,到面对危险气象的时候要提前做什么准备。

google最新研究给气象预告带来了一个新的进展:Scalable Ensemble Envelope Diffusion Sampler(SEEDS)是一个生成式的 AI 模型,可以高效地生成规模化的气象预告汇合,成本仅为保守鉴于物理的猜测模型的一小部分。

这项技术为气象和气象科学开辟了新的机遇,它同时也代表了几率集中模型在气象和气象猜测中的首次应用。

AI 猜测蝴蝶效应?google最新气象预告模型 SEEDS 登 Science 子刊

生成式 AI 精确生成气象预告汇合

在上述论文中,google提出了可扩展的汇合包络集中采样器(SEEDS),这是一种用于气象预告汇合生成的生成式人工智能技术。

SEEDS 鉴于去噪集中几率模型,这是一种由 Google Research 部分开创的最先进的生成式人工智能要领。

生成式人工智能以生成非常详细的图像和视频而闻名,这一特性对于生成与真实气象形式一致的汇合预告特别有用。

SEEDS 可以根据操作性数值气象预告系统中的一两个预告来生成大量的汇合。

生成的汇合在技能指标上与鉴于物理的汇合相匹配或超过,比如均方根缺点(RMSE)和连续排名几率评分(CRPS)等;不仅如此,还为预告分布的尾部(如 ±2σ 和 ±3σ 气象事变)分配了更精确的可能性。

AI 猜测蝴蝶效应?google最新气象预告模型 SEEDS 登 Science 子刊

AI 猜测蝴蝶效应?google最新气象预告模型 SEEDS 登 Science 子刊

保守物理要领和 SEEDS 的生成对比

最重要的是,与必要数小时计算时间的超级计算机相比,该模型的计算成本几乎可以忽略不计。在 Google Cloud TPUv3-32 实例上,其吞吐量为每 3 分钟 256 个汇合成员(分辨率为 2°),并且可以通过部署更多加速器轻松扩展到更高的吞吐量。

下图对比了 SEEDS 与操作性美国气象预告系统(全球汇合预告系统,GEFS)在 2022 年欧洲热浪期间某个特定日期的预告结果。

其中 A 是真实观测的代理,(Ca-Ch)是 SEEDS 摹拟出来的 8 个样本,而(Da-Dh)是来自 GEFS 的预告。虽然肉眼可能很难直接看出明显的区别,但 SEEDS 更能捕捉到交叉场和空间相关性,这会与真实的气象更加贴近。

这是因为 SEEDS 直接摹拟了大气状态的联合分布,它实际上捕捉了大气状态的空间协方差和中对流层高度和平均海平面气压之间的相关性,这两者常被气象学家用于预告评估和验证。(一些专业的解释:平均海平面气压的梯度驱动着地表的风,而中对流层高度的梯度则产生了移动大尺度气象形式的高层风。)

AI 猜测蝴蝶效应?google最新气象预告模型 SEEDS 登 Science 子刊

更精确地覆盖极其事变

SEEDS 汇合能够从一两个种子预告中外推,展示了可能的气象状态的范围,对事变的统计覆盖更好。

也就是说,高度可扩展的生成要领能够创建非常大的汇合,可以通过任何不同状态阈值设置的气象样本,来描述非常罕见的事变。

比如说下图展示了 2022 年 7 月 14 日当地时间 1:00 在里斯本附近发生的极其高温事变的 2 米温度和总柱水汽的联合分布。

对于每个图,google研究团队使用 SEEDS 根据 2 个物理模型的种子预告,生成了 16384 个成员的汇合,显示为绿色点。

正确气象事变来自 ERA5,用星号表示。

用方块表示用于保守要领生成汇合的预告,用三角形表示剩余的保守要领汇合成员。

AI 猜测蝴蝶效应?google最新气象预告模型 SEEDS 登 Science 子刊

可以看到蓝色方块和黄色三角形根本不接近星号,也就是说,保守方式根本不可能提前观察到这种极其情况,其 31 个成员中没有一个猜测到与观察到的那样温暖的近地表温度。

实际上,从高斯核密度估计中计算的事变几率低于 1%,这意味着少于 100 个成员的汇合不太可能包含与此事变一样极其的预告。

而 SEEDS 生成的绿色点,却可以提供更好的统计覆盖,鉴于它精准的生成能力和高效的生成速度。

气象预告新形式?

上述实验展示了一种混合预告系统,SEEDS 利用鉴于物理模型计算出的少数几条气象轨迹来更有效地生成更多预告的集中模型。

这种要领提供了一种替代当前操作性气象预告范式的要领。

同时,通过统计摹拟器节省的计算资源可以用于提高鉴于物理模型的分辨率或更频繁地发布预告。

这或许是气象预告的未来新形式,也可能 SEEDS 仅代表了未来几年 AI 将加速操作性数值气象预告进展的众多方式之一。

但google研究展现出来的是生成式人工智能在气象预告摹拟和后处理中的实用性,对于精确量化未来气象的不确定性和气象风险评估,提供了一个新的方向。

参考资料:

https://blog.research.google/2024/03/generative-ai-to-quantify-uncertainty.html

本文来自微信公众号:新智元 (ID:AI_era)

给TA打赏
共{{data.count}}人
人已打赏
AI

最新华文大模型测评:百川智能 Baichuan 3 国际第一

2024-4-30 19:43:20

AI

美国酝酿 AI「登月计划」,陶哲轩领衔 62 页报告重磅发布

2024-5-1 14:54:04

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索