揭秘100年全球海洋脱氧,上交大通过人工智能重建「窒息的海洋」,ICML已收录

作者 | 卢彬,韩璐羽海洋溶解氧是维持海洋生态系统功能的关键因子。然而,随着全球变暖和人类活动影响加剧,近年来海洋呈现脱氧趋势,日渐窒息的海洋对渔业发展、气候调节等多方面造成严重后果。近期,上海交通大学电子信息与电气工程学院王新兵、甘小莺教授团队联合上海交通大学海洋学院张经院士、周磊教授、周韫韬副教授,共同提出了一种稀疏海洋观测数据驱动的深度图学习模型 OxyGenerator,首次对 1920 年至 2023 年全球百年海域溶解氧数据进行重建,重建性能显著超越了专家经验主导的 CMIP6 系列数值模式结果。研究成

揭秘100年全球海洋脱氧,上交大通过人工智能重建「窒息的海洋」,ICML已收录

作者 | 卢彬,韩璐羽

海洋溶解氧是维持海洋生态系统功能的关键因子。然而,随着全球变暖和人类活动影响加剧,近年来海洋呈现脱氧趋势,日渐窒息的海洋对渔业发展、气候调节等多方面造成严重后果。

近期,上海交通大学电子信息与电气工程学院王新兵、甘小莺教授团队联合上海交通大学海洋学院张经院士、周磊教授、周韫韬副教授,共同提出了一种稀疏海洋观测数据驱动的深度图学习模型 OxyGenerator,首次对 1920 年至 2023 年全球百年海域溶解氧数据进行重建,重建性能显著超越了专家经验主导的 CMIP6 系列数值模式结果。

研究成果《OxyGenerator: Reconstructing Global Ocean Deoxygenation Over a Century with Deep Learning》目前已被中国计算机学会 A 类会议 International Conference on Machine Learning(ICML)录用,为分析复杂氧循环及气候调节提供了有力的数据支持,是人工智能与海洋学交叉融合的积极尝试。

重建数据表明过去百年间溶解氧最小值低于 30µmol/kg 的最小含氧带(OMZ30)快速扩张,2023 年较 1920 年面积扩大三倍有余。这一发现对于理解OMZ长期变化具有重要意义,有助于未来更好地进行海洋监测与保护。

揭秘100年全球海洋脱氧,上交大通过人工智能重建「窒息的海洋」,ICML已收录

论文链接:http://arxiv.org/abs/2405.07233

为了全面深入理解海洋脱氧,从有效数据中发掘氧循环及其变化规律,2017 年 Schmidtko 等研究者于《Nature》发文《Decline in global oceanic oxygen content during the past five decades》,首次采用空间插值方法实现了 1960 年以来全球海洋溶解氧数据的重建与定量分析。

然而,对于评估工业革命以来长期人类活动的具体影响,重建近五十年溶解氧记录远远不够。高度稀疏的历史观测和精度受限的空间插值方法成为解决问题的重要瓶颈。

揭秘100年全球海洋脱氧,上交大通过人工智能重建「窒息的海洋」,ICML已收录

World Ocean Database 2018、CLIVAR and Carbon Hydrographic Database、Argo、Global Ocean Data Analysis Project version2.2022、Geotraces IDP 等五个主要公开溶解氧数据库的观测数据量,海洋观测数据缺失率超过 90%

为此,上海交大的研究团队汇聚了自 1900 年以来包括科考船航次调查数据、Argo 浮标观测数据、深海潜标实时观测等海洋溶解氧相关数据共计 60 亿条(存储数据量约 2TB),并进行了统一质控。

考虑到海洋水体的不规则边缘,以及高度稀疏观测数据的非均匀特征,通过图建模思想建立了四维时空图网络,充分考虑了地理学中的空间相关性、高价值观测样本,实现了观测数据与缺失数据间的跨时空信息传递。

鉴于海洋溶解氧的浓度变化同时受到了海洋物理与生化变量的影响,首先采用多层感知机对多要素数据的进行非线性特征提取,并通过双向长短期记忆网络进行溶解氧观测值的时序变化特征挖掘。

其次,由于全球海洋在不同历史时期和区域呈现异质时空关联,受到海洋学分区思想的启发,提出了自适应可变分区的图消息传递机制(Zoning-Varying Message-Passing),通过超网络参数生成算法,对不同分区的图消息进行仿射变换,实现可变分区的图信息传递。

最后,海洋学领域知识的融合有助于校准神经网络的不确定性。本研究将海洋中氮、磷、氧的理想平衡比例关系(Redfield Ratio),设计了化学知识嵌入的梯度正则化方法,尽可能消除重建结果中的信号异常。

揭秘100年全球海洋脱氧,上交大通过人工智能重建「窒息的海洋」,ICML已收录

OxyGenerator 海洋脱氧重建框架

经与观测变量的多折交叉验证,与专家主导的三组 CMIP6 数值模式结果对比,本研究提出的 OxyGenerator 在四个重建性能评估指标上都取得了最佳表现,MAPE 减小了 38.77%,大大降低在开阔海域的重建误差。

揭秘100年全球海洋脱氧,上交大通过人工智能重建「窒息的海洋」,ICML已收录

OxyGenerator 与 CMIP6 实验性能比较

在观测数据充足的西太平洋、受特殊环境条件影响的黑海等区域,OxyGenerator 表现尤为突出,模型性能在百年间保持稳定。同时,结果很好地重建了历史时期厄尔尼诺/拉尼娜等特殊气候事件对溶解氧分布的扰动,也准确体现了温盐环流等大时间尺度水体运动特征。

本研究是人工智能与海洋科学深度交叉、密切合作的研究成果,为应对全球性气候挑战开拓了新思路。未来,团队将继续推进深入合作数据驱动的地学科学发现研究,积极发展先进技术赋能科学智能(AI for Science)领域研究。

相关资讯

提前预警平均6-7天,基于实时观测数据的时空信息转化学习的地震前兆预警

编辑 | 绿萝2023年9月5日,国际学术期刊《Proceedings of the National Academy of Sciences of the United States of America》在线发表了中国科学院生物化学与细胞生物学研究所陈洛南研究组与华南理工大学数学学院刘锐研究组合作的题为「Earthquake alerting based on spatial geodetic data by spatiotemporal information transformation learning」

大模型首次接入天文望远镜:“星语 3.0”发布,基于阿里通义千问

4 月 14 日,中国科学院国家天文台人工智能工作组发布新一代天文大模型 ——“星语 3.0”。“星语 3.0”基于阿里云通义千问开源模型打造,目前已成功接入国家天文台兴隆观测站望远镜阵列 —— Mini“司天”。据介绍,随着望远镜数量的不断增加,如何控制大型望远镜阵列已成为当今天文界共同面临的挑战。以往天文观测主要依赖观测助手和科研人员的配合。科研人员往往需要根据观测所在地气象情况修改观测计划,在观测室等待数据返回并实时分析数据,再根据结果修改观测计划。重要观测目标的每个环节都需要人工参与,效率低且难以同时控制多

青岛:力争到 2026 年全市算力总规模达 12EFLOPS,存储总量达 10EB

青岛市人民政府办公厅 6 月 7 日印发了《青岛市海洋人工智能大模型产业集聚区建设实施方案(2024—2026 年)》。IT之家汇总《方案》所提出的目标如下:到 2026 年,海洋人工智能大模型产业基础更加坚实、规模持续扩大、生态加速形成、赋能海洋产业转型升级更加明显,国内外首创性、引领性、示范性作用进一步加强,打造世界级海洋人工智能大模型产业集聚区。建设科技创新策源地,构建包含“瀚海星云”大模型在内的基础大模型矩阵、以“问海”大模型和港口大模型为代表的 N 个行业大模型和 X 个重点应用场景的“1 N X”海洋人