据谷歌新闻稿,谷歌公司正持续投入资源开发可用于识别鲸鱼声音的 AI 模型,其最新的多物种鲸鱼声音模型能够识别 8 种鲸鱼的叫声,并进一步细分其中两种鲸鱼的不同发声类型。
谷歌表示,这项技术主要用于海洋学术研究,能够帮助科研团队获取布氏鲸等“较难以观察的”鲸群行为模式,目前该模型已公开供学术人员下载使用,AI在线附地址(点此访问)。
据悉,谷歌公司自 2018 年以来便与美国国家海洋和大气管理局(NOAA)的太平洋群岛渔业科学中心合作,展开鲸鱼叫声分类的研究。最初,他们针对座头鲸开发了检测模型,成功辨识座头鲸的鸣叫声,从而成功获得了相关鲸群在特定时间地点的鸣叫规律,还借此发现了鲸群新栖息地。
谷歌还与加拿大渔业及海洋部(DFO)、Rainforest Connection 合作,针对濒临灭绝的南方定居型虎鲸开发了一系列检测模型,并将其应用于水下麦克风监测网络,能够实时报告虎鲸的位置给 DFO 和相关单位。
谷歌公司提到,如今该公司的鲸鱼声音识别模型可以识别座头鲸、虎鲸、蓝鲸、长须鲸、小须鲸、布氏鲸、北大西洋露脊鲸和北太平洋露脊鲸,考虑到鲸鱼声音覆盖频率范围极广(例如蓝鲸发声为 10 Hz 低频、齿鲸发声为 120 kHz 高频),因此该模型在科研层面可谓创举。
▲ 鲸鱼声音频率,图源谷歌
AI在线获悉,在开发这款鲸鱼声音识别模型时,研究人员首先将原始音频转换为时频谱(Spectrogram)以作为模型识别声音的基础,其中每个时间窗包含 5 秒钟的声音片段。接着,模型利用梅尔刻度法调整这些时频谱的声音频率,并通过压缩和正则化突出声音特征,进而将其分类为不同鲸鱼的鸣叫类别。
由于海中存在各种声音,研究人员还加入了大量背景声音来训练模型,以确保能够准确识别鲸鱼声音并排除噪音。实验结果显示该鲸鱼声音识别模型能够良好地区分不同种类的鲸鱼,特别是小须鲸和布氏鲸的声音。