作者 | 卢彬,韩璐羽
海洋溶解氧是维持海洋生态系统功能的关键因子。然而,随着全球变暖和人类活动影响加剧,近年来海洋呈现脱氧趋势,日渐窒息的海洋对渔业发展、气候调节等多方面造成严重后果。
近期,上海交通大学电子信息与电气工程学院王新兵、甘小莺教授团队联合上海交通大学海洋学院张经院士、周磊教授、周韫韬副教授,共同提出了一种稀疏海洋观测数据驱动的深度图学习模型 OxyGenerator,首次对 1920 年至 2023 年全球百年海域溶解氧数据进行重建,重建性能显著超越了专家经验主导的 CMIP6 系列数值模式结果。
研究成果《OxyGenerator: Reconstructing Global Ocean Deoxygenation Over a Century with Deep Learning》目前已被中国计算机学会 A 类会议 International Conference on Machine Learning(ICML)录用,为分析复杂氧循环及气候调节提供了有力的数据支持,是人工智能与海洋学交叉融合的积极尝试。
重建数据表明过去百年间溶解氧最小值低于 30µmol/kg 的最小含氧带(OMZ30)快速扩张,2023 年较 1920 年面积扩大三倍有余。这一发现对于理解OMZ长期变化具有重要意义,有助于未来更好地进行海洋监测与保护。
论文链接:http://arxiv.org/abs/2405.07233
为了全面深入理解海洋脱氧,从有效数据中发掘氧循环及其变化规律,2017 年 Schmidtko 等研究者于《Nature》发文《Decline in global oceanic oxygen content during the past five decades》,首次采用空间插值方法实现了 1960 年以来全球海洋溶解氧数据的重建与定量分析。
然而,对于评估工业革命以来长期人类活动的具体影响,重建近五十年溶解氧记录远远不够。高度稀疏的历史观测和精度受限的空间插值方法成为解决问题的重要瓶颈。
World Ocean Database 2018、CLIVAR and Carbon Hydrographic Database、Argo、Global Ocean Data Analysis Project version2.2022、Geotraces IDP 等五个主要公开溶解氧数据库的观测数据量,海洋观测数据缺失率超过 90%
为此,上海交大的研究团队汇聚了自 1900 年以来包括科考船航次调查数据、Argo 浮标观测数据、深海潜标实时观测等海洋溶解氧相关数据共计 60 亿条(存储数据量约 2TB),并进行了统一质控。
考虑到海洋水体的不规则边缘,以及高度稀疏观测数据的非均匀特征,通过图建模思想建立了四维时空图网络,充分考虑了地理学中的空间相关性、高价值观测样本,实现了观测数据与缺失数据间的跨时空信息传递。
鉴于海洋溶解氧的浓度变化同时受到了海洋物理与生化变量的影响,首先采用多层感知机对多要素数据的进行非线性特征提取,并通过双向长短期记忆网络进行溶解氧观测值的时序变化特征挖掘。
其次,由于全球海洋在不同历史时期和区域呈现异质时空关联,受到海洋学分区思想的启发,提出了自适应可变分区的图消息传递机制(Zoning-Varying Message-Passing),通过超网络参数生成算法,对不同分区的图消息进行仿射变换,实现可变分区的图信息传递。
最后,海洋学领域知识的融合有助于校准神经网络的不确定性。本研究将海洋中氮、磷、氧的理想平衡比例关系(Redfield Ratio),设计了化学知识嵌入的梯度正则化方法,尽可能消除重建结果中的信号异常。
OxyGenerator 海洋脱氧重建框架
经与观测变量的多折交叉验证,与专家主导的三组 CMIP6 数值模式结果对比,本研究提出的 OxyGenerator 在四个重建性能评估指标上都取得了最佳表现,MAPE 减小了 38.77%,大大降低在开阔海域的重建误差。
OxyGenerator 与 CMIP6 实验性能比较
在观测数据充足的西太平洋、受特殊环境条件影响的黑海等区域,OxyGenerator 表现尤为突出,模型性能在百年间保持稳定。同时,结果很好地重建了历史时期厄尔尼诺/拉尼娜等特殊气候事件对溶解氧分布的扰动,也准确体现了温盐环流等大时间尺度水体运动特征。
本研究是人工智能与海洋科学深度交叉、密切合作的研究成果,为应对全球性气候挑战开拓了新思路。未来,团队将继续推进深入合作数据驱动的地学科学发现研究,积极发展先进技术赋能科学智能(AI for Science)领域研究。