编辑 | ScienceAI
预测降水、温度和风等天气变量对于社会生产生活至关重要。随着更多的极端天气出现,比如洪水、干旱和热浪等,准确的预报对于准备和减轻其影响尤为重要。未来的前 24 小时很关键,因为它们具有高度可预测性和可操作性,可以帮助人们及时做出明智的决策并保证安全。
深度神经网络为天气条件建模提供了另一种范例。一旦数据可用,神经模型就能在不到一秒的时间内做出预测,并且具有非常高的时间和空间分辨率,以及直接从大气观测中学习的能力。
使用大气观测、最高保真度和最低延迟数据训练的神经模型,与最先进的概率数值天气预报模型相比,迄今为止仅在 12小 时的提前期内取得了良好的性能,并且仅适用于降水这一唯一变量。
近日, Google Research 和 Google DeepMind 开发了一个名为 MetNet-3 的新天气模型。它大大扩展了基于观察的神经模型可以预测的前置时间范围和变量。
图:MetNet-3 模型架构。(来源:论文)
MetNet-3 以早期的 MetNet 和 MetNet-2 模型为基础,可提前 24 小时对更多核心变量进行高分辨率预测,包括降水、表面温度、风速和风向以及露点。
MetNet-3 提供了一个时间平滑且高度精细的预报,提前时间间隔为 2 分钟,空间分辨率为 1 至 4 公里。与传统方法相比,MetNet-3 实现了强大的性能,优于最好的基于物理的单成员和多成员数值天气预报 (NWP) 模型(例如 HRRR 和 ENS),可提前 24 小时预报多个地区。该研究为基于观测的神经模型树立了新的性能里程碑。
研究人员在与天气相关的各种 Google 产品和技术中集成了 MetNet-3 的功能。MetNet-3 目前在美国本土和欧洲部分地区推出,重点是 12 小时降水预报,正在帮助为多个国家和语言的人们提供准确可靠的天气信息。
该研究以《Deep Learning for Day Forecasts from Sparse Observation》为题,发布在 arXiv 预印平台上。
论文链接:https://doi.org/10.48550/arXiv.2306.06079
图示:MetNet-3 降水输出在移动设备上的 Google 搜索中汇总为可行的预测。(来源:报道)
稀疏观测的致密化
最近的许多机器学习天气模型使用传统方法(例如,NWP 的数据同化)生成的大气状态作为建立预报的主要起点。相比之下,MetNet 模型的一个决定性特征是使用对大气的直接观测来进行训练和评估。直接观察的优点是它们通常具有更高的保真度和分辨率。然而,直接观测来自不同高度的各种传感器,包括地面气象站和轨道卫星,并且可能具有不同程度的稀疏性。例如,来自 NOAA 多雷达/多传感器系统 (MRMS) 等雷达的降水估计是相对密集的图像,而位于地面的气象站提供诸如温度和风等变量的测量值,只是分布在一个地区的点。
除了之前 MetNet 模型中使用的数据源之外,MetNet-3 还包括气象站的点测量作为输入和目标,目的是在所有位置进行预测。为此,MetNet-3 的关键创新是一种称为致密化(densification)的技术,它将基于物理的模型中传统的数据同化和模拟的两步过程合并到神经网络的单次传递中。致密化的主要组成部分如下所示。尽管致密化技术单独适用于特定的数据流,但由此产生的致密化预测受益于进入 MetNet-3 的所有其他输入流,包括地形、卫星、雷达和 NWP 分析功能。MetNet-3 的默认输入中不包含 NWP 预测。
图:致密化技术。(来源:报道)
空间和时间高分辨率
使用直接观测的一个核心优势是其高空间和时间分辨率。例如,气象站和地面雷达站分别每隔几分钟在特定点以 1 公里的分辨率提供测量结果;这与 SOTA 模型 ENS 的同化状态形成鲜明对比,该模型每 6 小时生成一次,分辨率为 9 公里,并进行每小时预测。
为了处理如此高分辨率,MetNet-3 保留了该系列模型的另一个定义特征,即提前期调节。以分钟为单位的预测提前时间直接作为神经网络的输入给出。这使得 MetNet-3 能够有效地对短至 2 分钟的时间间隔内的观测的高时间频率进行建模。致密化与提前时间调节和高分辨率直接观测相结合,可生成时间分辨率为 2 分钟的全密集 24 小时预报,同时从遍布美国的一分钟观测 (OMO) 气象站网络中的 1,000 个点进行学习。
MetNet-3 预测每个输出变量和每个位置的边际多项式概率分布,提供超出平均值的丰富信息。这使研究人员能够将 MetNet-3 的概率输出与高级概率集成 NWP 模型的输出进行比较,包括欧洲中期天气预报中心的集合预报ENS和美国国家海洋和大气管理局的高分辨率集合预报(HREF)。由于两个模型输出的概率性质,研究人员能够计算分数,例如连续排名概率分数(CRPS)。下图突出显示了致密化结果,并说明 MetNet 的预测不仅具有更高的分辨率,而且在重叠交付周期进行评估时也更加准确。
图:MetNet-3对未来24小时内每2分钟的风速进行预测,空间分辨率为4公里;ENS 每小时预报,空间分辨率为 18 公里。(来源:报道)
图:基于 CRPS 的 MetNet-3 和 NWP 风速基线的性能比较(越低越好)。(来源:报道)
与气象站变量相比,降水估计更密集,因为它们来自地面雷达。MetNet-3 的降水建模与 MetNet-1 和 2 类似,但将 1 公里空间粒度的高分辨率降水预报扩展到与其他变量相同的 24 小时提前时间,如下面的动画所示。MetNet-3 在降水方面的性能在整个 24 小时范围内实现了比 ENS 更好的 CRPS 值。
图:ENS 的每小时预测;地面实况,来源 NOAA 的 MRMS;MetNet-3 预测的概率图。(来源:报道)
图:CRPS 上瞬时降水率的 MetNet-3 和 NWP 基线之间的性能比较(越低越好)。(来源:报道)
提供实时 ML 预测
根据历史数据训练和评估像 MetNet-3 这样的天气预报模型只是向用户提供基于 ML 的预测过程的一部分。开发实时天气预报 ML 系统时需要考虑很多因素,例如从多个不同来源获取实时输入数据、运行推理、实现输出的实时验证、从模型的丰富输出中构建洞察,从而带来直观的用户体验,并以 Google 规模提供结果——所有这些都是连续循环的,每隔几分钟刷新一次。
该团队开发了这样一个实时系统,能够每隔几分钟为整个美国本土和欧洲 27 个国家提供降水预报,交付时间长达 12 小时。
图:使用 MetNet-3 生成降水预报的过程。(来源:报道)
该系统的独特性源于其使用近乎连续的推理,这使得模型能够根据传入的数据流不断创建完整的预测。这种推理模式不同于传统的推理系统,由于输入数据的独特特征,这种推理模式是必要的。该模型采用各种数据源作为输入,例如雷达、卫星和数值天气预报同化。这些输入中的每一个都具有不同的刷新频率以及空间和时间分辨率。一些数据源(例如天气观测和雷达)具有类似于连续数据流的特征,而其他数据源(例如数值天气预报同化)则类似于批量数据。该系统能够在空间和时间上对齐所有这些数据源,从而使模型能够以非常高的节奏创建对未来 12 小时降水的最新预测。
通过上述过程,模型能够预测任意离散概率分布。研究人员开发了新颖的技术,将这种密集的输出空间转换为用户友好的信息,从而在整个 Google 产品和技术中提供丰富的体验。
Google 产品中的天气功能
世界各地的人们每天都依靠 Google 来提供有用、及时且准确的天气信息。这些信息有多种用途,例如规划户外活动、旅行打包以及在恶劣天气事件中保持安全。
MetNet-3 的最先进的准确性、高时间和空间分辨率以及概率性质使得创建独特的超本地天气见解成为可能。对于邻近的美国和欧洲,MetNet-3 已投入运行,可生成实时 12 小时降水预报,这些预报现已在与天气相关的 Google 产品和技术(例如搜索)中提供服务。模型的丰富输出被合成为可操作的信息,并立即提供给数百万用户。
例如,通过移动设备搜索精确位置的天气信息的用户将收到高度本地化的降水预报数据,包括根据产品细分的时间线图。
图:Android 上的 Google 应用程序(左)和移动网络搜索(右)显示天气中的 MetNet-3 降水量输出。(来源:报道)
结论
MetNet-3 是一种新的天气预报深度学习模型,在对一组核心天气变量进行 24 小时预报方面,其性能优于最先进的基于物理的模型。它有潜力为天气预报创造新的可能性,并提高许多活动的安全性和效率,例如交通、农业和能源生产。MetNet-3 已投入运行,其预报可在多个与天气相关的 Google 产品中提供。
相关报道:https://blog.research.google/2023/11/metnet-3-state-of-art-neural-weather.html